可能重复:
什么是清理Word生成的HTML最好的免费的方式?
PHP来清理粘贴微软输入
我允许客户在一个富文本编辑器中输入笔记和最近才升级到CKEDITOR 3倍,在默认情况下剥离MS词类,风格和评论(当用户粘贴到编辑器对象)。 所以前进我都准备好。
我最近有一个需要清洗5年价值的纸币其中一些已经产生MS Word生成的HTML嵌入。 我需要遍历这个正文和清洁。
我并不需要去掉所有span标签,只有那些书面微软标识。
我已经使用HTMLCleaner尝试过,但不删除MS生成的HTML。 http://word2cleanhtml.com不正是我想要的,但是开发商目前没有提供给公众使用的API(如2012年7月9日)。
我看过这样一类和关闭在过去的几个星期,我没有多少运气。 有任何你找到你想分享一个有用的?