正方体OCR相机(Tesseract OCR Camera)

2019-07-30 23:47发布

我使用的Tesseract OCR 3.01在我的iPhone应用程序,它显示了90%的准确度为我的数据当我拿起从我的手机图书馆的形象。 但是,如果使用相同的图像从摄像机,它显示混乱的字母。 我跟着这个教程 ,请指引我,如果事情可以做,以确保它从相机的工作原理,因为它适用于画廊图像。

Answer 1:

几乎可以肯定的问题是“方向”。 苹果,往往会造成在一个位图形式的图像 - 图像比特被布置为如果照相机是在其一侧与音量按钮顶部和右侧。 你看这照片看起来比更宽仍如上布局高,但有附带图像的“方向”中的EXIF对象。

我要去猜测,正方体不看EXIF,但预计在图像中的“标准”格式,以便文本是这将是一个人阅读的文本的位置。

您可以通过使用音量按钮右上角的相机拍摄的图像测试我的假设。

如果他们的工作,那么你需要做的是处理图像自己,并重新安排每个方向设置的位。 这是不是所有的很难做到,但需要您在VIMAGE和/或位图上下文读了。



Answer 2:

是啊,有三件事情要具体,首先,OCR与黑白图像,而不是颜色的效果很好,所以,如果你可以尝试图像为黑白转换,它会增加精度。

第二件事是大小和方向,你需要给力的图像是640 * 480或320的尺寸,这将增加识别和精确度两者的速度时,为了定向,有很多的方式来管理。

最后,如果一些如何可以允许用户指定的确切位置或他希望进行OCR图像的哪一部分,这极大地提高了精度和时间,因为库不需要检查整个图像的文本,而你已经指定要搜索的一部分。

PS:我一直在努力,在过去几周内创建一个OCR应用程序。



文章来源: Tesseract OCR Camera