我试图建立在Java示例应用程序,将读取的图像文件,只是输出从图像中提取文本。 我发现这个正方体项目,该项目很有前途,然而,它在C ++中。 为了使用它,我应该简单地运行它从我的Java应用程序的命令行Runtime.exec(...)
还是有更好的解决办法,也许是JAR? 此外,这只是一个示例应用程序,将运行它作为一个命令行应用程序从可扩展性的角度关注?
Answer 1:
现在的Tesseract是由javacv项目提供,这比使用Tess4J因为所有需要的是在加入一个依赖于你的POM文件一个更好的选择,为您的平台的本地库将被下载,并通过自动为您链接javacv正方体版本。
我创建了一个例子Maven项目在这里- https://github.com/piersy/BasicTesseractExample
并且也是一个例子gradle这个项目在这里- https://github.com/piersy/BasicTesseractExampleGradle
对于这个我的Ubuntu的机器上工作,我需要更新我安装的libstdc ++ 6
我通过运行虽然只是安装的libstdc ++ 6可以为你工作如下实现这一点。
sudo add-apt-repository ppa:ubuntu-toolchain-r/test
sudo apt-get update
sudo apt-get install libstdc++6
注意gradle这个项目不进行自动安装,但依然有很多比使用Tess4J简单的地狱
该javacv项目是在这里- https://github.com/bytedeco/javacpp-presets/tree/master/tesseract
大道具的javacv家伙,只希望我能发现这个早些时候,因为它会一个星期有救了我让tess4j在多个平台上工作的!
Answer 2:
我在Java代码中使用的正方体项目。 所有你需要做的是
- 获取正方体的tess4j JNI包装。
- 打开tess4j凸出在你的IDE,并添加源包和库到你自己
项目。 - 编写代码为正方体类创建一个实例,然后用它来
执行OCR。
请看看这个http://tphangout.com/?p=18
它详细介绍了如何建立一个Java项目来读取图像,并使用OCR的Tesseract API将其转换成文本指令。
Answer 3:
你试过tess4j: http://tess4j.sourceforge.net/ 。
这是正方体的Windows的JNI包装。
Answer 4:
我分叉了基本的Git回购和更新,以便它可以与正方体-OCR版(4.XX)兼容,bytedeco javacpp-预设版本(1.4.3)。
BasicTesseractExampleVer4
Answer 5:
只是试图https://github.com/piersy/BasicTesseractExample
看起来像它的工作原理,只使用一个依赖于这一点:
<dependency> <groupId>org.bytedeco.javacpp-presets</groupId> <artifactId>tesseract</artifactId> <version>3.03-rc1-0.11</version> </dependency>
这是在这里: https://github.com/bytedeco/javacpp-presets/tree/master/tesseract
欢呼声科拉多
Answer 6:
我用这个如何使用Appium来测试吐司消息?
有了这个
<dependency>
<groupId>net.sourceforge.tess4j</groupId>
<artifactId>tess4j</artifactId>
<version>3.2.1</version>
</dependency>