创建正方体OCR训练图像(Creating a training image for Tessera

2019-07-03 21:35发布

我正在写一个生成器,用于训练图像的正方体OCR。

当生成为正方体OCR新字体的训练图像,什么是最好的价值:

  1. 该DPI
  2. 以点为单位的字体大小
  3. 如果字体是反锯齿或不
  4. 如果边界框紧贴: , 或不:

Answer 1:

第2届问题以某种方式在这里得到解答: http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3#Generate_Training_Images 没有必要利用多种尺寸的训练。 10点就行了。 (一个例外是非常小的文本。如果要识别文本与x高度小于15像素,您应该专门训练它,或者试图识别它们之前缩放图像。)

问题1和3:根据经验,我已经成功地使用300个dpi的图像/非反锯齿字体。 更具体而言,我已经使用在训练PDF,其产生令人满意的图像以下转换参数:

convert -density 300 -depth 8 [input].pdf -background white -flatten +matte -compress none -monochrome [output].tif

但是,我试图虚线字体添加到超正方体,当我使用的150 dpi的图像只检测出正确的字符。 所以,我不认为有一个通用的解决方案,这取决于那种你想添加的字体。



Answer 2:

我找到了答案,4号的问题 - “如果该边框紧贴”。

看来,尽可能多地安装矩形给出了更好的结果。

对于其他的12分和300 dpi的就可以了,因为@Yaroslav建议。 我认为抗锯齿更好关闭。



Answer 3:

为正方体训练好工具http://vietocr.sourceforge.net/training.html

这是因为有数量优势的好工具

  1. 在信中边界框可以通过基于GUI界面编辑
  2. 自动创建所有需要的文件
  3. 自动组合等频率-耶,字耶,用户字的所有文件(可以是空的文件),Inttemp,Normproto,Pffmtable,Unicharset,DangAmbigs(可以是空的文件),shapetable成单eng.traineddata文件。
  4. 新的训练数据可以与现有的Tesseract文件中使用end.traineddata


文章来源: Creating a training image for Tesseract OCR
标签: ocr tesseract