使用PDFBox的[复制]一个特定的页面阅读文本(read text from a particul

2019-08-03 04:42发布

这个问题已经在这里有一个答案:

  • 使用PDFBox的从PDF文档阅读特定的页面 6个回答

我知道如何阅读使用整个PDF文件usinf PDFBox的文本PDFTextStripper.getText(PDDocument)

我也有关于如何获取的对象引用使用特定页面的样本PDDocumentCatalog.getAllPages().get(i)

如何获得使用PDFBox的,因为我没有看到任何这样的方法只有一个页面的文本PDPage类?

Answer 1:

您可以在设置参数PDFTextStripper读取特定页面:

PDDocument doc; // document
int i; // page no.

PDFTextStripper reader = new PDFTextStripper();
reader.setStartPage(i);
reader.setEndPage(i);
String pageText = reader.getText(doc);

据我所知, PDPage是代表一个网页屏幕上,而不是提取文本更习惯。 因此,我不建议使用这种提取文本。



文章来源: read text from a particular page using PDFBox [duplicate]
标签: java pdfbox