我有一个大的文本文件, iso-8859-1
编码这是我从获得:
file -i file.txt
当我的猫一个文件,查看数据,将有一个,而不是泰国的字符串。 起初,我认为我可以只使用iconv
在linux下的编码格式转换成我发现可以阅读泰国字符串,并认为它会奏效ISO-8859-11格式其它类型。 事情是这样的:
iconv -f iso-8859-1 -t iso-8859-11 file.txt > output.txt
但是,相反,我得到这个错误:
iconv: illegal input sequence at position 1169
这是具有的位置。 我试着用//TRANSLIT
但仍然有不可读的字符。
有没有我可以把这个文本文件中读取泰国串什么办法? 我知道我可以只打开一个文件的一些文本编辑器并保存为我想一个编码格式,但我有太多的文件,每个文件几乎是一千兆字节大小。 我认为,iconv可以helpe我的每一个文件转换,而无需手动转换每一个。
PS。 我尝试用Python的开放:
with open('file.txt','r+', encoding='iso-8859-11') as f:
print(f.read())
它可以完美阅读泰语字符,但我需要所以需要的iconv这里将大块和许多文件。