【doc转html代码】如何把word转换成HTML?我想把word文档转换为...
C#实现的word转html命令行工具,对情况进行了解和思考后,认为可以通过一个中间程序自动化的将word文档转换成为excel,遂决定写个程序来实现这个转换环节。
对于这种纯Windows的需求,估计也就是JAVA或者是VS系列语言更加方便一些。
最近的项目使用的语言主要是JAVA、VC++,C#还没有尝试过完成实际项目,于是打算用C#尝试实现一下。
http://blog.csdn.net/solomonlangrui/article/details/47168449...
word中怎样插入html代码?
域是WORD中的一种特殊命令,它由花括号、域名(域代码)及选项开关构成。
域代码类似于公式,域选项并关是特殊指令,在域中可触发特定的操作。
在用WORD处理文档时若能巧妙应用域,会给我们的工作带来极大的方便。
特别是制作理科等试卷时,有着公式编辑器不可替代的优点。
一、更新域操作当WORD文档中的域没有显示出最新信息时,用户应采取以下措施进行更新,以获得新域结果。
1、更新单个域:首先单击需要更新的域或域结果,然后按下F9键。
2、更新一篇文档中所有域:执行“编辑”菜单中的“全选”命令,选定整篇文档,然后按下F9键。
另外,用户也可以执行“工具”菜单中的“选项”命令,并单击“打印”选项卡,然后选中“更新域”复选框,以实现WORD在每次打印前都自动更新文档中所有域的目的。
二、显示或隐藏域代码1、显示或者隐藏指定的域代码:首先单击需要实现域代码的域或其结果,然后按下“SHIFT+F9”组合键。
2、显示或者隐藏文档中所有域代码:按下“ALT+F9”组合键。
三、锁定/解除域操作1、要锁定某个域,以防止修改当前的域结果的方法是:单击此域,然后按下“CTRL+F11”组合键。
2、要解除锁定,以便对域进行更改的方法是:单击此域,然后按下“CTRL+SHIFT+F11”组合键。
四、解除域的链接首先选择有关域内容,然后按下“CTRL+SHIFT+F9”组合键即可解除域的链接,此时当前的域结果就会变为常规文本(即失去域的所有功能),以后它当然再也不能进行更新了。
用户若需要重新更新信息,必须在文档中插入同样的域才能达到目的。
五、用域创建上划线在“插入”菜单项下选“域”,在“域代码”处输入EQ开关参数,确定。
注意在“EQ”和开关参数之间有一个空格,例如输入Y平均值(Y带有上划线),插入域为“EQ \x\to?Y?”? 单击“确定”后便会出现“Y”的样式。
六、用域输入分数输入分数通常是用WORD的公式编辑器来完成,其实用域输入更简单易行。
操作时首先将光标定位在要输入分数(例如输入“”)的地方,按“Ctrl+F9”,(也可以单击菜单栏“插入”“域”命令,然后在“域名”列表框中找到“eq”项后,单击“域”对话框下面的“确定”即可。
插入域定义符“”,然后在“”中输入表示公式的字符串“eq空格\f(a ? b) ”,然后在其上单击鼠标右键,在弹出的快捷菜单中选择“切换到域代码”命令,就会产生域结果“”。
对于带分数,只需在真分数“”前面输入整数部分1就变成了带分数“1”。
当然你可以极大地发挥他的作用和你的聪明才智,综合应用这些域,灵活地输入像“”等形式的分数。
而且用这种方法输入的分数等域结果在排版时会跟随其他文字一同移动,不会像使用公式编辑器插入的对象那样会因排版而错位。
如果输入分数较多,可以先输入一个分数的域代码,然后复制、粘贴再进行数值修改即可提高输入速度。
在“eq空格\f(a ? b) ”中,eq表示创建科学公式的域名, \f???为创建分式公式的开关选项。
其他常用开关选项还有创建根式的\r???、创建上标下标的\s???、以及建立积分的\i????等。
关于域代码和公式的对应关系,可以查看WORD中关于域的“帮助”信息。
七、用域统计文档字数①将鼠标定位到需要字数统计的地方(如文档未尾),然后输入关于提示字数统计结果的文字(如“本文总字数为:” )。
②在菜单栏中选择“插入”“域”命令项,进入到“域”对话框。
③在“域”对话框中,首先选择“类别”列表中的“文档信息”项,然后从“域名”列表框中选择“NumWords”项。
该项用于统计文档总字数,也可以根据需要选择“NumChars”项来统计文档总字符数,选择“NumPages”项来统计文档的总页数,再使用左键单击“选项”按钮,进入到“域选项”对话框中。
④在“域选项”对话框中,先在“格式”列表框中选择“1,2,3,…”项,然后单击“添加到域”按钮,将所选择的格式添加到域格式中,再单击“确定”按钮返回到“域”对话框中。
⑤在“域”对话框中单击“确定”按钮,即可关闭所有对话框,并返回到文档编辑状态,此时可以看到在当前光标处显示出了“本文总字数:XXXX”的字样。
⑥当插入上述域之后,如果对文档进行了修改,移动鼠标将光标定位在域代码上(此时颜色会变为灰色),然后按下F9键,WORD会自动更新该域,并显示出更新后的总字数。
⑦为了方便,我们可以在每篇文档中都插入字灵敏统计结果 。
怎么在网页中打开word文档.用代码实现
将Word转Html的原理是这样的:1、客户上传Word文档到服务器2、服务器调用OpenOffice程序打开上传的Word文档3、OpenOffice将Word文档另存为Html格式4、Over至此可见,这要求服务器端安装OpenOffice软件,其实也可以是MS Office,不过OpenOffice的优势是跨平台,你懂的。
恩,说明一下,本文的测试基于 MS Win7 Ultimate X64 系统。
下面就是规规矩矩的实现。
1、下载OpenOffice,2、下载Jodconverter 这是一个开启OpenOffice进行格式转化的第三方jar包。
3、泡杯热茶,等待下载。
4、安装OpenOffice,安装结束后,调用cmd,启动OpenOffice的一项服务:C:\Program Files (x86)\OpenOffice.org 3\program>soffice -headless -accept="socket,port=8100;urp;"5、打开eclipse6、喝杯热茶,等待eclipse打开。
7、新建eclipse项目,导入Jodconverter/lib 下得jar包。
* commons-io * jodconverter * juh * jurt * ridl * slf4j-api * slf4j-jdk14 * unoil * xstream 8、Coding...查看代码package com.mzule.doc2html.util;import java.io.BufferedReader;import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.IOException;import java.io.InputStreamReader;import java.net.ConnectException;import java.util.Date;import java.util.regex.Matcher;import java.util.regex.Pattern;import com.artofsolving.jodconverter.DocumentConverter;import com.artofsolving.jodconverter.openoffice.connection.OpenOfficeConnection;import com.artofsolving.jodconverter.openoffice.connection.SocketOpenOfficeConnection;import com.artofsolving.jodconverter.openoffice.converter.OpenOfficeDocumentConverter;/** * 将Word文档转换成html字符串的工具类 * * @author MZULE * */public class Doc2Html { public static void main(String[] args) { System.out .println(toHtmlString(new File("C:/test/test.doc"), "C:/test")); } /** * 将word文档转换成html文档 * * @param docFile * 需要转换的word文档 * @param filepath * 转换之后html的存放路径 * @return 转换之后的html文件 */ public static File convert(File docFile, String filepath) { // 创建保存html的文件 File htmlFile = new File(filepath + "/" + new Date().getTime() + ".html"); // 创建Openoffice连接 OpenOfficeConnection con = new SocketOpenOfficeConnection(8100); try { // 连接 con.connect(); } catch (ConnectException e) { System.out.println("获取OpenOffice连接失败..."); e.printStackTrace(); } // 创建转换器 DocumentConverter converter = new OpenOfficeDocumentConverter(con); // 转换文档问html converter.convert(docFile, htmlFile); // 关闭openoffice连接 con.disconnect(); return htmlFile; } /** * 将word转换成html文件,并且获取html文件代码。
* * @param docFile * 需要转换的文档 * @param filepath * 文档中图片的保存位置 * @return 转换成功的html代码 */ public static String toHtmlString(File docFile, String filepath) { // 转换word文档 File htmlFile = convert(docFile, filepath); // 获取html文件流 StringBuffer htmlSb = new StringBuffer(); try { BufferedReader br = new BufferedReader(new InputStreamReader( new FileInputStream(htmlFile))); while (br.ready()) { htmlSb.append(br.readLine()); } br.close(); // 删除临时文件 htmlFile.delete(); } catch (FileNotFoundException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } // HTML文件字符串 String htmlStr = htmlSb.toString(); // 返回经过清洁的html文本 return clearFormat(htmlStr, filepath); } /** * 清除一些不需要的html标记 * * @param htmlStr * 带有复杂html标记的html语句 * @return 去除了不需要html标记的语句 */ protected static String clearFormat(String htmlStr, String docImgPath) { // 获取body内容的正则 String bodyReg = ""; Pattern bodyPattern = Pattern.compile(bodyReg); Matcher bodyMatcher = bodyPattern.matcher(htmlStr); if (bodyMatcher.find()) { // 获取BODY内容,并转化BODY标签为DIV htmlStr = bodyMatcher.group().replaceFirst("", ""); } // 调整图片地址 htmlStr = htmlStr.replaceAll("转换成保留样式 // content = content.replaceAll("(]*>.*?)()", // ""); // 把转换成并删除样式 htmlStr = htmlStr.replaceAll("(]*)(>.*?)()", ""); // 删除不需要的标签 htmlStr = htmlStr .replaceAll( "]*?>", ""); // 删除不需要的属性 htmlStr = htmlStr .replaceAll( "]*)(?:lang|LANG|class|CLASS|style|STYLE|size|SIZE|face|FACE|[ovwxpOVWXP]:\\w+)=(?:'[^']*'|\"\"[^\"\"]*\"\"|[^>]+)([^>]*)>", ""); return htmlStr; }}
在word中编辑网页如何转化成源代码?我有个二级网站,就像支持h
呵呵 这个东西我可以很准确的告诉你是不可能的。
用Dreamweaver编辑,你要想想,网页中各个部分都是要定位的,而word可以随意拖动,如果能用word写网页的话,那大家都用了,那个多方便。
用Dreamweaver吧,在Dreamweaver中把那些编辑好,然后点击代码,就是html代码了。
如果满意请采纳,如有疑问请追问。
转载请注明出处51数据库 » 在线word转html代码
晴天10718621