清理Word产生的HTML垃圾代码
相信大多数人写日志的时候都没有使用专业的写博客软件,如:Windows Live Writer。Office Word这个大家都熟悉的软件是Bolger们立即浮现在脑中的离线编辑软件。偶也是最熟悉Word,用起来得心应手。用Word来写文章然后发表到网络上最大的毛病就是它产生的一大堆垃圾代码。
今天在思考如何解决这个问题的时候找到了一个老外写的JS脚本,能够去除SPAN标签、Class 属性、Style 属性、Lang 属性、XML 元素和声明、带XML名字空间声明的标签和 空格,并将<P>标签转换成<DIV>。
去掉空格和转换<P>标签的功能是不必要的,我把它去掉了,再加上了去除FONT标签的功能。欢迎大家试用。
December 5th, 2007 at 10:09 pm
不错,优化一下吧,哈哈
December 26th, 2007 at 3:01 am
其实很多小工作,是很有作用的,会对一些工作产生意想不到的效果的!
January 2nd, 2008 at 1:15 am
有个问题想请教一下,如果某个博客的后台用户有几千人,大多都是用word写完复制到后台发布的,有没有办法在后台编辑器上加js?或者在副模板里写js?这样省去手工一个个的去复制几千个网友提交的文章了。
January 2nd, 2008 at 6:17 pm
开源的编辑器如FCK这样的应该好加一段JS,让程序员看看就好了