我期待处理一堆有手写的信息对他们的接触(即姓名,地址,电话,电子邮件等)扫描响应明信片。
我很好奇,如果有一个可行的开源库或一个软件来做到这一点(理想Java或R)。 在寻找身边的很多信息是从2009年或早期并不十分令人鼓舞。
语言是英语。
有什么建议?
编辑:我已经看过了OCRopus网页,但最新的版本是从2009年5月任何人有任何这方面的经验或者是有一个较新的版本?
我期待处理一堆有手写的信息对他们的接触(即姓名,地址,电话,电子邮件等)扫描响应明信片。
我很好奇,如果有一个可行的开源库或一个软件来做到这一点(理想Java或R)。 在寻找身边的很多信息是从2009年或早期并不十分令人鼓舞。
语言是英语。
有什么建议?
编辑:我已经看过了OCRopus网页,但最新的版本是从2009年5月任何人有任何这方面的经验或者是有一个较新的版本?
首先,据我所知没有本地开源的Java SDK的OCR。 有其包装要求原生接口,tesjeract(的Java API http://code.google.com/p/tesjeract/ )或Tess4J( http://tess4j.sf.net/ )。
接下来,你需要指定你是否寻找手写或手写文本。 如果你需要手写文字识别 - 我不敢相信你就可以解决的,因为在其他的答案陈述的理由,你的任务。
但是,如果你需要ICR(即代表智能字符识别)进行手写文本(在调查中,表格等使用,而清晰的字母),有可能是一个解决方案。 虽然我beleive是正方体(尽管被认为是最好的开源引擎之间)对你不会做的工作在这里,你可以寻找更准确的SDK。
也许这个问题会有所帮助: 手写扫描文件到txt文件?
我不知道任何的工作开源手写识别库,无论我在OCR空间一会儿了。 通常笔迹比OCR更困难,我会说,没有像样甚至商业解决方案。 所有存在都有自己的事情,只能在工作很窄的应用程序时,词典是有限的像,文字写得很好,等等。如果你仍然有兴趣我会建议您检查技术,从法国公司I2IA
你可能想看看http://code.google.com/p/ocropus/ ,这是一个开源的OCR系统。
但是,它出现在C ++和Python编写。
* 更新:*
由于该研究项目之一是手写的分析器我希望它可以帮助。
该OCRopus引擎是基于两个研究项目:美国人口普查局在90年代中期开发和部署高性能的手写识别,和新颖的高性能布局分析方法。
如果你看一下http://code.google.com/p/ocropus/source/browse/的源文件已经自10/2011(三之一是从3/2012)更新的,所以它看起来是目前正在开发依然。