用C读取.DOCX ++(Reading .docx in C++)

2019-06-26 12:04发布

我试图创建一个程序,读取.docx文件并将其发布内容到博客/论坛,供个人使用。 我终于想通了如何使用libcurl中做(我想通)是该计划的一部分更难。 现在我只需要读取.docx文件,但一个障碍下也来了。 我似乎无法找到如何做到这一点的任何文档。 有任何想法吗?

Answer 1:

最简单的方法是使用Word来做到这一点。 它有许可限制。

所谓问题创建,打开和打印从C ++ Word文件有一些很好的参考。

编辑:

根据这些问题/答案都可以解压打开XML文件,并直接处理XML文件:

  • 我如何可以读取Word 2007的.docx文件?

如果您使用.NET有更多的(C#)的问题如下:

  • 如何抢在C#从字(DOCX)文档中的文本?
  • 如何加载MS Word文档中的C#(.NET)?
  • 我如何编程使用C#追加多个docx文件一起?


Answer 2:

如果你想留在开源的世界里,OpenOffice的3应该能够处理的.docx文件。 还有就是要实现许多语言的API项目,我真的不知道它是如何完成的或复杂的。

有一个脚本在PHP中,可以从.DOCX转换为纯文本。 也就是说,如果你不害怕,所有的文档是俄语)。 这可能是另一种选择(触发PHP脚本使用系统调用和解析该文件中的结果)



文章来源: Reading .docx in C++