我想所有的转换.odt
.doc
.xls
.pdf
文件.txt
文件。
我想将这些文件转换使用shell脚本或Perl脚本到文本文件
我想所有的转换.odt
.doc
.xls
.pdf
文件.txt
文件。
我想将这些文件转换使用shell脚本或Perl脚本到文本文件
有对ODT文件和类似的系统程序:
odt2txt -产品相关图片回购。
$ unoconv --format=txt document1.odt
应该产生document1.txt。
OpenOffice的有一个内置的文档转换器能够处理一堆formats-的看看unoconv: http://dag.wieers.com/home-made/unoconv/
话虽这么说,我有一些麻烦让,在过去 - 工作,如果你遇到问题,看看对于AbiWord的类似程序(另一个开源文字处理器)。
Word文档,你可以尝试antiword
,至少在Linux上。 这是一个命令行实用程序,需要一个Word文档作为参数,并吐出了从文档中的文本(是最好的,它可以计算)到标准输出。 也许你也可以指定一个输出中的文件。 我不记得它是如何工作的细节。 我没有在使用了一段时间了。 不知道是否可以处理文档OO。
这当然可以做到这一点,虽然有一些奇怪的事情和坚不可摧的有关OO项目和它的文档,使得这样的事情很难研究和效仿。 然而,OO已经把所有那些类型,而不仅仅是OO本地的人的能力,它可以通过两种不同形式的自动化控制的做到这一点。
这是两种常用的方法。
你可以开始OO并告诉它执行宏它做这件工作给你一个给定文件。 然后,您只需要编写宏和脚本来遍历文件。 语法是一样的东西
$ oowriter -headless名宏://dir/Standard.Module1.sMySub
另一件事OO已经是一个网络API。 这是基于一种叫做UNO。
$ oowriter -accept =接受字符串
Notifies the OpenOffice.org software that upon the creation of "UNO Acceptor Threads", a "UNO Accept String" will be used.
您将需要某种形式的客户端库。 我认为他们有一个为Python至少。 使用这种技术Python程序或其他一些脚本语言与面向对象的客户端库可以驱动程序和转换的所有文件。 由于OO读取MSO,它应该能够做到所有的人。
对于微软的格式,窥视wvWare工具 。
开放的.ods在自由报办公室正常文件
突出显示文本转换
打开终端
你运行
按“I”获得插入模式
按Ctrl-Shift-V
完成!
需要一些格式化?
将文件另存为
走出六
跑:
$猫| 柱>文件名2
这个工作在运行的openSUSE KDE
替代“KWrite这样的”为“六”,如果你想