我正在写一个生成器,用于训练图像的正方体OCR。
当生成为正方体OCR新字体的训练图像,什么是最好的价值:
- 该DPI
- 以点为单位的字体大小
- 如果字体是反锯齿或不
- 如果边界框紧贴: , 或不:
我正在写一个生成器,用于训练图像的正方体OCR。
当生成为正方体OCR新字体的训练图像,什么是最好的价值:
第2届问题以某种方式在这里得到解答: http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3#Generate_Training_Images 没有必要利用多种尺寸的训练。 10点就行了。 (一个例外是非常小的文本。如果要识别文本与x高度小于15像素,您应该专门训练它,或者试图识别它们之前缩放图像。)
问题1和3:根据经验,我已经成功地使用300个dpi的图像/非反锯齿字体。 更具体而言,我已经使用在训练PDF,其产生令人满意的图像以下转换参数:
convert -density 300 -depth 8 [input].pdf -background white -flatten +matte -compress none -monochrome [output].tif
但是,我试图虚线字体添加到超正方体,当我使用的150 dpi的图像只检测出正确的字符。 所以,我不认为有一个通用的解决方案,这取决于那种你想添加的字体。
我找到了答案,4号的问题 - “如果该边框紧贴”。
看来,尽可能多地安装矩形给出了更好的结果。
对于其他的12分和300 dpi的就可以了,因为@Yaroslav建议。 我认为抗锯齿更好关闭。
为正方体训练好工具http://vietocr.sourceforge.net/training.html
这是因为有数量优势的好工具
eng.traineddata
文件。 end.traineddata