为了识别两种语言,我用的Tesseract 2个traineddata文件。 但由于准确性不够好,我训练的Tesseract与生产,我想与我使用这两种语言的一个文件合并成为一个新的traineddata文件。 所以我的问题是:怎样才能够在新traineddata文件与被这里找到其中的一个文件合并: https://code.google.com/p/tesseract-ocr/downloads/list 。任何帮助吗?
Answer 1:
您可以解压缩现有.traineddata
并分别合并组成部分; 但是,我不知道这是去上班。 您可以创建ell1.traineddata
,并与现有的在命令行中,如同时指定它:
tesseract image output -l ell+ell1
文章来源: Merge trained data files - Tesseract