我有一个给我提供了一个文本文件中,没有人知道它的编码。 在文本编辑器看着它,一切都看起来不错,正确对齐成整洁的列。
但是,我看到一些异常,当我读到的数据。 即便如此,在视觉上,该领域的“富”出现在文本文件中的同一列(例如,列15-20),当我试图把它拉出来使用substring(15,20)
我的数据变化很大。 有时我会拉字节11-16,18-23有时,有时15-20 ...有记录之间没有一致性。
我怀疑,有一些特殊的chartacters,看不到我的文本编辑器,但可读(和指数计)的String
的方法。 有没有在Java中的任何方式来转储文件的内容有任何特殊字符可见这样我就可以看到我所需要的字符串,我需要用正则表达式替换?
如果没有在Java中,任何人都可以推荐一个工具,也许能帮助我吗?