无法转换为可读字符串的iconv(Cannot convert � to readable stri

2019-10-29 06:53发布

我有一个大的文本文件, iso-8859-1编码这是我从获得:

file -i file.txt

当我的猫一个文件,查看数据,将有一个,而不是泰国的字符串。 起初,我认为我可以只使用iconv在linux下的编码格式转换成我发现可以阅读泰国字符串,并认为它会奏效ISO-8859-11格式其它类型。 事情是这样的:

iconv -f iso-8859-1 -t iso-8859-11 file.txt > output.txt

但是,相反,我得到这个错误:

iconv: illegal input sequence at position 1169

这是具有的位置。 我试着用//TRANSLIT但仍然有不可读的字符。

有没有我可以把这个文本文件中读取泰国串什么办法? 我知道我可以只打开一个文件的一些文本编辑器并保存为我想一个编码格式,但我有太多的文件,每个文件几乎是一千兆字节大小。 我认为,iconv可以helpe我的每一个文件转换,而无需手动转换每一个。

PS。 我尝试用Python的开放:

with open('file.txt','r+', encoding='iso-8859-11') as f:
   print(f.read())

它可以完美阅读泰语字符,但我需要所以需要的iconv这里将大块和许多文件。

文章来源: Cannot convert � to readable string with iconv