一、html导出word有哪些好的解决方案
1、实现富文本中样式代码的分离;
2、保留CSS样式;
其实以上两个步骤是相互矛盾的处理过程,无法通过Jacob或POI组件加正则表达式过滤解决,于是进行了以下步骤的实验:
1、首先创建了一个空白word文档,格式(office 2003格式或office 2007格式)不限;
2、将word格式保存为html格式,通过Edit Plus打开,发现代码中使用了office的命名空间,同时使用了office命名空间的标签定义了CSS样式,自己测试了一下,将生成的html文件头和尾拷贝出来:代码如下:
以上HTML头是office的命名空间定义。
3、将使用富文本代码粘贴到红色标识的中,并以doc或docx格式保存文件;
4、大功告成,打开文件时,Word将会以“Web版视图”完美显示了富文本样式,成功解决了富文本代码中样式代码,并同时保留了格式;
目前研究的仅能保存文字,未处理有图片的代码,朋友们可以再研究一下带图片的富文本代码的转换;
二、HTML怎么导出生成word文档
1、保存网页
在浏览器中访问目标网页,执行菜单“文件”→“另存为”,文件类型选择“网页,全部”。
2、用WPS文字打开html文件
执行“文件”→“打开”,文件类型选择“网页文件”或“所有文件”,以打开刚才下载得到的《[征稿八]怎样用WPS制作PDF》html文件。
3、去掉不需要的部分
注:表格形式出现的正文,可以选中后执行“表格”→“转换”→“表格转换为文本”去除表格外框。
4、最后另存为WPS文档或WORD文档即可。
三、怎样把html文件转换成word格式
首先, 将 HTML 文件双击打开:
1. 在网页中, Ctrl-A, Ctrl-C, 打开 word, Ctrl-V
2. 如果你用的 IE, 在同一台机子又装了 Office, 那你可以留意一下右键, 或者上下左右的按钮, 当中应该有个键是 "传送到 Word" ( 也有传送到 Excel ) 的
3. 如果你只是想把网页撷取起来展示予人, 那你可以考虑装个 Foxit, Primo PDF 之类的 "pdf 印表机" ( 这方法会是失真最少的 )
转载请注明出处51数据库 » chtml导出word