我试图创建一个程序,读取.docx文件并将其发布内容到博客/论坛,供个人使用。 我终于想通了如何使用libcurl中做(我想通)是该计划的一部分更难。 现在我只需要读取.docx文件,但一个障碍下也来了。 我似乎无法找到如何做到这一点的任何文档。 有任何想法吗?
Answer 1:
最简单的方法是使用Word来做到这一点。 它有许可限制。
所谓问题创建,打开和打印从C ++ Word文件有一些很好的参考。
编辑:
根据这些问题/答案都可以解压打开XML文件,并直接处理XML文件:
- 我如何可以读取Word 2007的.docx文件?
如果您使用.NET有更多的(C#)的问题如下:
- 如何抢在C#从字(DOCX)文档中的文本?
- 如何加载MS Word文档中的C#(.NET)?
- 我如何编程使用C#追加多个docx文件一起?
Answer 2:
如果你想留在开源的世界里,OpenOffice的3应该能够处理的.docx文件。 还有就是要实现许多语言的API项目,我真的不知道它是如何完成的或复杂的。
有一个脚本在PHP中,可以从.DOCX转换为纯文本。 也就是说,如果你不害怕,所有的文档是俄语)。 这可能是另一种选择(触发PHP脚本使用系统调用和解析该文件中的结果)
文章来源: Reading .docx in C++