iText的API为PDF比较(iText API for PDF comparison)

2019-07-04 12:12发布

我可以使用iText的API用于比较两个PDF文件? 我已经通过计算器上的各种方法去PDF文件比较,如工具,有些工具如ImageMagick的等等,我想比较的PDF文件与图表,表格和文本等fiancial报告,我们有比较大量的文件并想通过命令行工具来做到这一点。 有一个ComparePDF命令行工具,但它只是输出两个文件是否conatining差异。 我们会想打印日志的文件差异。 我们可以通过iText的做到这一点?

Answer 1:

你要什么比较? iText的可用于比较的结构和语法,但...这看起来与人眼两个不同的PDF文件,可能有完全不同的结构和语法内部。

在iText的,我们已经编写了使用GhostScript的创建每一页的图像JUnit测试。 这些图像被相互比较每个像素的基础上。

我们还使用的iText在JUnit测试,而这些测试看的结构和语法比内容更。



Answer 2:

您需要使用迈尔斯O(ND)为PDF比较差异算法,iText的或PDFBOX API不提供PDF比较方法,可以提取这些文件的文本,并使用iText的坐标,以后使用的迈尔斯O(ND)DIFF算法找出差异和突出的变化。



文章来源: iText API for PDF comparison
标签: java pdf itext