最近,我碰上了正方体和OpenCV的 。 它看起来像正方体是一个成熟的OCR引擎和OpenCV可以作为一个框架来创建一个OCR应用程序/服务。
我试着用一些我的图片的正方体和其准确性似乎体面。 后来,我碰到一个很简单的来了教程使用OpenCV的执行使用Python OCR和留下了深刻印象。 过了几分钟,我完成训练系统及其精度良好。 但当然,采用这种方法意味着我需要广泛的训练我的系统中使用大的训练集。
我的具体问题如下:
- 如何一个正方体,并选择使用的OpenCV建立一个自定义应用程序的OCR?
- 有许多可用于正方体不同语言的训练数据集。 OpenCV中是否有类似的东西,这样我就不必启动地面上来实现OCR?
- 哪一个是一个想成为的商业应用更好吗?
有什么建议?
如果你想获得的OCR有多难是一个基本的了解,尝试OpenCV的。 正方体是真实的 OCR。
我是你提到的数字识别教程的作者, 我会说,这是没有的正方体的方式替代。
正方体是一个非常好的OCR引擎,可能是最好的开放源代码OCR引擎。
你提到的教程也只是一种尝试,了解OCR的最简单的工作。
所以,如果你正在寻找应用OCR,我会建议你使用OpenCV进行预处理的图像,然后应用正方体引擎。
两者可以是互补的。 如果你阅读OpenCV的纸: https://github.com/tesseract-ocr/docs/blob/master/tesseracticdar2007.pdf
它强调说,“由于惠普已经自主开发是在产品中使用的,(因此不会发布为开源)页面布局分析技术的Tesseract从来不需要自己的页面布局分析。因此正方体假定其输入是一个二进制映像可选的多边形文本区域定义“。
此类型的任务可以通过OpenCV中来执行,并且所得到的图像切换到超正方体。 你可以在Git的回购这种类型的代码示例: https://github.com/Itseez/opencv_contrib/tree/master/modules/text/samples样品用正方体的API做图像的文本转换。
OpenCV的是库CV ,用于分析和一般处理图像。 正方体是一个图书馆OCR ,这是简历的一个专门的子集专设从图像中提取文本。
从OpenCV.org
.....用于检测和识别人脸,识别物体,分类视频中的人的行为,跟踪摄像机运动,追踪移动物体,提取物体的3D模型,产生从立体相机三维点云,图像拼接在一起,以产生高整个场景的高分辨率图像,找到图像数据库相似的图像,使用闪光灯拍摄图像去除红眼,跟随眼球运动,认识风光和建立标记与增强现实等来覆盖它
从正方体Github上 :
.....可以直接使用API来提取输入,手写或从图像印刷文本中使用,或(程序员)。 它支持各种语言。