使用.NET PDF文档中提取标记为编校文本[关闭](Extracting text marked

2019-10-17 04:05发布

我工作的一个PDF杂技演员附加产品和要求之一是提取标记为一个给定的PDF文档中的密文的文本。

假设你知道什么是“新版本”(请阅读本如果不http://acrobatusers.com/tutorials/redacting-pdf-files-survey-tools ),请建议我怎么能发现坐标为在任何PDF新版本已被“标记”,然后文本中提取的确切文本。

请询问更多的细节,如果你相信你能带我到正确的答案。 我已经使用了相同的iTextSharp的和Aspose.PDF库,但没有成功尝试。

Answer 1:

当你标记为与Acrobat编校文本,它会创建新版本的注释。 新版本的注释有/子键设置为/纂。 新版本区域由在注释词典/ QuadPoints键定义。 我不知道,如果iTextSharp的或阅读Aspose支持新版本的注释。 随着iTextSharp的你可以使用API​​ COS检索原始PDF对象和检查你所需要的对象。



文章来源: Extracting text marked for redaction in a PDF document using .NET [closed]