我目前的项目涉及转录文本的PDF转换成文本文件,我第一次尝试把图像文件直接进入OCR程序(正方体)和它没有”把它做好。 原始图像文件是旧新闻报纸,基本上,并有一定的背景噪音,我确信正方体有问题。 所以我想馈入正方体之前使用的一些图像的预处理。 是否有一个开放源码的图像预处理引擎,非常适合这种情况的任何建议??? 以及如何使用它的说明会更感激!
Answer 1:
我从来没有听说过“ 图像预处理引擎 ”用于这一目的的,但你可以看看的OpenCV (开源计算机视觉库),并实现自己的“ 预处理引擎 ”。 OpenCV的是计算机视觉库,它提供了许多功能来进行图像处理。
一个有趣的事,作为一个预处理步骤是应用阈值的图像去噪和东西你可能想测试。 无论如何, 我已经谈到了这样的东西,在这个线程 。
Answer 2:
就像提到@karlphillip,我高度怀疑有一个现成的预处理引擎为您的目的为预处理技术与期望的结果相差很大。
到清理噪声图像的文本的一些常见的方法包括:1.自适应阈值(Sauvola或Niblack二值化)2.应用一个尺寸比文本获得的背景图像稍大的中值过滤器,然后减去从背景原始图像(以除去像折痕,污渍,手写笔记等的较大的噪声)。
OpenCV的这些过滤器/二值化方法的实现。 如果你有机会到公开发表的文献有在嘈杂的文件的二进制相当多的工作。
Answer 3:
退房ScanTailor 。 它有非常令人印象深刻的预处理功能,并且它是开源的。
文章来源: Image Preprocessing before OCR process