用于OCR图像处理用leptonica(反色文本)(Image processing for OCR

2019-06-26 14:08发布

我试图用leptonica处理下面的图片中提取与正方体文本。

原始图像:

正方体的原始图像上产生这样的:

i s l
D2J1FiiE-l191x1iitmwii9 uhiaiislz-2 Q ~37
Bottom linez
With a little time!
you can learn social media technology
using free online resources-
And if you donity
youlll be at a significant disadvantage
to
other HOn-pFOiiTS-

不是很大,尤其是顶部的背景。 因此,使用leptionica我使用背景去除算法(模糊,差,阈值,反转),以获得下面的图片:

但是正方体并没有用它做的工作:

@@r-mair lkrm@W lh@w ilr@ mJs@ iklh@ ii@c2lhm1@ll
mm Mime
VWU1 a Mitt-Jle time-
@1m ll@@Wn Om @@@lh1
using free onhne resources-
Andifyoudoni
9110 ate a $0 D
to other non-profrts
I

主要的问题,似乎是,现在所有的文字概述,而不是固体。 我该如何调整自己的算法或者我能加入到做文字结实吗?

Answer 1:

看来,本文提出了一种解决您的问题,二值化方法:

ŤKasar,J Kumar和AG莱玛克里斯南。 字体和背景颜色独立文本二值化 。 (2007年)



文章来源: Image processing for OCR with leptonica (inverse color text)