我想构建,通过OCR库,应该从它扫描图片中提取文本的Android应用程序。
我应该使用哪种Java库?
我想构建,通过OCR库,应该从它扫描图片中提取文本的Android应用程序。
我应该使用哪种Java库?
不知道它有多好(它肯定需要先经过培训),但有罗恩Cemer的Java OCR库 。
如果你正在寻找一个非常可扩展选项,或有一个特定的问题域,你可以考虑使用滚动自己的面向神经引擎Java对象 。
我用它成功地在一个个人项目,以确定从图像信如这个 ,你可以找到所有的来源我在GitHub上的应用程序的OCR组成部分, 在这里 。
尝试正方体,结帐本文http://www.itwizard.ro/interfacing-cc-libraries-via-jni-example-tesseract-163.html和这个例子http://code.google.com/p/mezzofanti/
编辑:一些更多的事实 - 正方体是由谷歌所使用的最好的开源OCR之一 - 没有可用于许多语言的训练数据 - mezzofanti是采用正方体的Android应用程序 - 请注意:OCR确实使用了大量的CPU功率。 试图OCR通过你的T-MOB G1一个A4页面会占用大量的时间,结果可能不会打动你;-)
您可以使用谷歌从文档的OCR功能。 检查文档列表数据API http://code.google.com/apis/documents/docs/3.0/developers_guide_protocol.html#OCR