是否忽视的Tesseract扫描的文档中的任何非文本区域？(Does Tesseract negle

2019-07-29 00:36发布

站内文章 / 后端开发

38 0

女 | 书童

私信

我使用的Tesseract，但我不知道它是否忽略任何非文本区域，只针对文本。我一定要删除任何非文本区域为更好的输出预处理步骤？

Answer 1:

正方体有着相当不错的算法来检测文本，但最终会产生假阳性匹配。

理想情况下，你会预先处理图像提交给正方体之前。前一段时间我从事类似的任务，所以我建议你看一看以下材料：

文章来源: Does Tesseract neglect any nontext area in a scanned document?

标签： image-processing ocr tesseract text-extraction

放荡不羁爱自由

女 | 书童

私信

Ta的文章更多文章

0条评论

还没有人评论过~