从Java中使用正方体(Using Tesseract from java)

2019-07-17 11:02发布

我试图建立在Java示例应用程序,将读取的图像文件,只是输出从图像中提取文本。 我发现这个正方体项目,该项目很有前途,然而,它在C ++中。 为了使用它,我应该简单地运行它从我的Java应用程序的命令行Runtime.exec(...) 还是有更好的解决办法,也许是JAR? 此外,这只是一个示例应用程序,将运行它作为一个命令行应用程序从可扩展性的角度关注?

Answer 1:

现在的Tesseract是由javacv项目提供,这比使用Tess4J因为所有需要的是在加入一个依赖于你的POM文件一个更好的选择,为您的平台的本地库将被下载,并通过自动为您链接javacv正方体版本。

我创建了一个例子Maven项目在这里- https://github.com/piersy/BasicTesseractExample

并且也是一个例子gradle这个项目在这里- https://github.com/piersy/BasicTesseractExampleGradle

对于这个我的Ubuntu的机器上工作,我需要更新我安装的libstdc ++ 6

我通过运行虽然只是安装的libstdc ++ 6可以为你工作如下实现这一点。

sudo add-apt-repository ppa:ubuntu-toolchain-r/test 
sudo apt-get update
sudo apt-get install libstdc++6

注意gradle这个项目不进行自动安装,但依然有很多比使用Tess4J简单的地狱

该javacv项目是在这里- https://github.com/bytedeco/javacpp-presets/tree/master/tesseract

大道具的javacv家伙,只希望我能发现这个早些时候,因为它会一个星期有救了我让tess4j在多个平台上工作的!



Answer 2:

我在Java代码中使用的正方体项目。 所有你需要做的是

  1. 获取正方体的tess4j JNI包装。
  2. 打开tess4j凸出在你的IDE,并添加源包和库到你自己
    项目。
  3. 编写代码为正方体类创建一个实例,然后用它来
    执行OCR。

请看看这个http://tphangout.com/?p=18

它详细介绍了如何建立一个Java项目来读取图像,并使用OCR的Tesseract API将其转换成文本指令。



Answer 3:

你试过tess4j: http://tess4j.sourceforge.net/ 。

这是正方体的Windows的JNI包装。



Answer 4:

我分叉了基本的Git回购和更新,以便它可以与正方体-OCR版(4.XX)兼容,bytedeco javacpp-预设版本(1.4.3)。

BasicTesseractExampleVer4



Answer 5:

只是试图https://github.com/piersy/BasicTesseractExample

看起来像它的工作原理,只使用一个依赖于这一点:

 <dependency> <groupId>org.bytedeco.javacpp-presets</groupId> <artifactId>tesseract</artifactId> <version>3.03-rc1-0.11</version> </dependency> 

这是在这里: https://github.com/bytedeco/javacpp-presets/tree/master/tesseract

欢呼声科拉多



Answer 6:

我用这个如何使用Appium来测试吐司消息?

有了这个

    <dependency>
        <groupId>net.sourceforge.tess4j</groupId>
        <artifactId>tess4j</artifactId>
        <version>3.2.1</version>
    </dependency>


文章来源: Using Tesseract from java