清理Word产生的HTML垃圾代码
相信大多数人写日志的时候都没有使用专业的写博客软件,如:Windows Live Writer。Office Word这个大家都熟悉的软件是Bolger们立即浮现在脑中的离线编辑软件。偶也是最熟悉Word,用起来得心应手。用Word来写文章然后发表到网络上最大的毛病就是它产生的一大堆垃圾代码。
今天在思考如何解决这个问题的时候找到了一个老外写的JS脚本,能够去除SPAN标签、Class 属性、Style 属性、Lang 属性、XML 元素和声明、带XML名字空间声明的标签和 空格,并将<P>标签转换成<DIV>。
去掉空格和转换<P>标签的功能是不必要的,我把它去掉了,再加上了去除FONT标签的功能。欢迎大家试用。