删除MS Word的“HTML”使用PHP [复制](Remove MS Word “HTML” u

2019-09-19 06:41发布

可能重复:
什么是清理Word生成的HTML最好的免费的方式?
PHP来清理粘贴微软输入

我允许客户在一个富文本编辑器中输入笔记和最近才升级到CKEDITOR 3倍,在默认情况下剥离MS词类,风格和评论(当用户粘贴到编辑器对象)。 所以前进我都准备好。

我最近有一个需要清洗5年价值的纸币其中一些已经产生MS Word生成的HTML嵌入。 我需要遍历这个正文和清洁。

我并不需要去掉所有span标签,只有那些书面微软标识。

我已经使用HTMLCleaner尝试过,但不删除MS生成的HTML。 http://word2cleanhtml.com不正是我想要的,但是开发商目前没有提供给公众使用的API(如2012年7月9日)。

我看过这样一类和关闭在过去的几个星期,我没有多少运气。 有任何你找到你想分享一个有用的?

Answer 1:

http://htmlpurifier.org/

这将做你想做的。



文章来源: Remove MS Word “HTML” using PHP [duplicate]