怎么在网页中打开word文档.用代码实现
将Word转Html的原理是这样的:1、客户上传Word文档到服务器2、服务器调用OpenOffice程序打开上传的Word文档3、OpenOffice将Word文档另存为Html格式4、Over至此可见,这要求服务器端安装OpenOffice软件,其实也可以是MS Office,不过OpenOffice的优势是跨平台,你懂的。
恩,说明一下,本文的测试基于 MS Win7 Ultimate X64 系统。
下面就是规规矩矩的实现。
1、下载OpenOffice,2、下载Jodconverter 这是一个开启OpenOffice进行格式转化的第三方jar包。
3、泡杯热茶,等待下载。
4、安装OpenOffice,安装结束后,调用cmd,启动OpenOffice的一项服务:C:\Program Files (x86)\OpenOffice.org 3\program>soffice -headless -accept="socket,port=8100;urp;"5、打开eclipse6、喝杯热茶,等待eclipse打开。
7、新建eclipse项目,导入Jodconverter/lib 下得jar包。
* commons-io * jodconverter * juh * jurt * ridl * slf4j-api * slf4j-jdk14 * unoil * xstream 8、Coding...查看代码package com.mzule.doc2html.util;import java.io.BufferedReader;import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.IOException;import java.io.InputStreamReader;import java.net.ConnectException;import java.util.Date;import java.util.regex.Matcher;import java.util.regex.Pattern;import com.artofsolving.jodconverter.DocumentConverter;import com.artofsolving.jodconverter.openoffice.connection.OpenOfficeConnection;import com.artofsolving.jodconverter.openoffice.connection.SocketOpenOfficeConnection;import com.artofsolving.jodconverter.openoffice.converter.OpenOfficeDocumentConverter;/** * 将Word文档转换成html字符串的工具类 * * @author MZULE * */public class Doc2Html { public static void main(String[] args) { System.out .println(toHtmlString(new File("C:/test/test.doc"), "C:/test")); } /** * 将word文档转换成html文档 * * @param docFile * 需要转换的word文档 * @param filepath * 转换之后html的存放路径 * @return 转换之后的html文件 */ public static File convert(File docFile, String filepath) { // 创建保存html的文件 File htmlFile = new File(filepath + "/" + new Date().getTime() + ".html"); // 创建Openoffice连接 OpenOfficeConnection con = new SocketOpenOfficeConnection(8100); try { // 连接 con.connect(); } catch (ConnectException e) { System.out.println("获取OpenOffice连接失败..."); e.printStackTrace(); } // 创建转换器 DocumentConverter converter = new OpenOfficeDocumentConverter(con); // 转换文档问html converter.convert(docFile, htmlFile); // 关闭openoffice连接 con.disconnect(); return htmlFile; } /** * 将word转换成html文件,并且获取html文件代码。
* * @param docFile * 需要转换的文档 * @param filepath * 文档中图片的保存位置 * @return 转换成功的html代码 */ public static String toHtmlString(File docFile, String filepath) { // 转换word文档 File htmlFile = convert(docFile, filepath); // 获取html文件流 StringBuffer htmlSb = new StringBuffer(); try { BufferedReader br = new BufferedReader(new InputStreamReader( new FileInputStream(htmlFile))); while (br.ready()) { htmlSb.append(br.readLine()); } br.close(); // 删除临时文件 htmlFile.delete(); } catch (FileNotFoundException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } // HTML文件字符串 String htmlStr = htmlSb.toString(); // 返回经过清洁的html文本 return clearFormat(htmlStr, filepath); } /** * 清除一些不需要的html标记 * * @param htmlStr * 带有复杂html标记的html语句 * @return 去除了不需要html标记的语句 */ protected static String clearFormat(String htmlStr, String docImgPath) { // 获取body内容的正则 String bodyReg = ""; Pattern bodyPattern = Pattern.compile(bodyReg); Matcher bodyMatcher = bodyPattern.matcher(htmlStr); if (bodyMatcher.find()) { // 获取BODY内容,并转化BODY标签为DIV htmlStr = bodyMatcher.group().replaceFirst("", ""); } // 调整图片地址 htmlStr = htmlStr.replaceAll("转换成保留样式 // content = content.replaceAll("(]*>.*?)()", // ""); // 把转换成并删除样式 htmlStr = htmlStr.replaceAll("(]*)(>.*?)()", ""); // 删除不需要的标签 htmlStr = htmlStr .replaceAll( "]*?>", ""); // 删除不需要的属性 htmlStr = htmlStr .replaceAll( "]*)(?:lang|LANG|class|CLASS|style|STYLE|size|SIZE|face|FACE|[ovwxpOVWXP]:\\w+)=(?:'[^']*'|\"\"[^\"\"]*\"\"|[^>]+)([^>]*)>", ""); return htmlStr; }}
怎样能在网页上显示一个word文档呢
1、打开Word文档,单击菜单栏中的“文件”→“打开”对话框; 2、在“文件名”编辑框中手动输入网页地址,并单击“打开”按钮;3、Word2003开始连接Web服务器,用户可以在Word窗口中看到目标网页内容;4、并且可以进行编辑、复制、删除和保存等操作,如图所示;5、选中需要复制的内容,并执行复制操作;6、然后新建一个Word文档,将复制的内容粘贴到新的Word文档中,保存即可。
word文档总以网页的方式打开怎么办?
1、右键单击任意一个Word文件,选择“打开方式”。
2、浏览--Microsoft Office--word--打开。
3、勾选始终使用选择的程序打开这种文件。
点击网页链接怎么打开的会是word
电脑点击网址链接打开word文档有两种可能:一、该链接链接地址是一个word文档,所以打开时自动跳转打开word。
二、在word中打开的那些链接都是*.php类型的,而在vista“文件类型或协议与程序关联”中,并没有对*.php做出关联,所以就变成了由word打开了*.php文件。
解决方法步骤如下:1、打开控制面板,选择“添加或删除程序”;2、选择“设置程序和默认访问值”,在自定义中,选择一个默认的浏览器,“将此程序设置为默认值”,即”使用所选程序打开在默认情况下能打开的所有文件类型和协议“。
如何在网页中显示WORD文档?
下边我把我的实战经验共享一下:1. word自动转换布局的功能其实并不是很好,往往造成与word内的布局错乱的情况。
让很多本来费了很多心思设计word布局的人非常恼火。
对于这种问题,我采用了现在word内设计表格布局的方法,把所有的内容都放在事先画好的表格内,并将表格的边框都设成无。
在设计时可以看到边框,在运行时就没有了,非常的便于设计。
一切都做好了,就该动手转换成网页了。
2. word提供了三种转换成网页的方式:a) 单个文件网页b) 网页c) 筛选过的网页l 如果选择a,word将会把文件转换为mhtml格式,所有word内的内容都会包含在一个文件里包括图片、表格等;l 如果选择b,则会把文件转换成一个带word自身标记符的html文件,并产生一个与此相关的网页图片存放文件夹,里边就是word内嵌的图片,但是已经经过了优化。
一般不大于60k;l 如果选择c,则会把文件转换成完全符合html标记的网页,并产生一个与此相关的网页图片存放文件夹,里边就是word内嵌的图片,但是已经经过了优化。
一般不大于60k;3.碰到的难题:要求将word转成单个文件网页――因为带图片文件夹维护起来比较麻烦。
但是发现将word转换为单个网页文件后,文件太大,完全不适合在internet上传输。
实战秘技:先将word文件按照c方式转换,会产生一个网页文件和一个图片文件夹。
这时将所有的文档都关掉,将产生的新网页文件打开。
然后全选(ctrl+a,ctrl+c)网页内容。
新建一个word文件,让后将内容拷贝其中(ctrl+v),然后在将这个文件转为 单个网页文件。
这时你会惊奇的发现,新产生的单个文件的网页的大小已经变的很小了。
怎么可以将打开的网页界面复制到word里
一、将打开的网页一图片的形式复制到Word里1、将要复制的内容调整在显示器的可见部位;2、按键盘的的Print Screen SusRq键;3、打开需要复制网页的一个“word”文档,单击开始----粘贴按钮即可。
二、将网页内容在Word文档中打开设置方法:1、在网页中单击文件----另存为命令;2、弹出保存网页对话框,将其保存;3、在该网页文件的图标上单击鼠标右键,在弹出的快捷菜单中选择打开方式----Microsoft Office Word;4、在Word中,单击窗口左上角的office按钮,在弹出的下拉选项中选择另存为;5、弹出另存为对话框,在保存类型处选择Word文档(*.doc)即可,如图所示。
怎么把网页保存为doc格式的文档?就是打开是word文档把它打开的,...
用Word来保存网页,最大的好处就是可以再编辑,去除一些无用的内容、不正确的内容和可以添加自己的内容等等。
针式个人知识库管理系统提供将分散的Word文件集中,提供方便的组织和检索功能等,让您可以专心于资料,而不必分心于文件管理等。
一般步骤:1、复制要收集网页的内容2、粘贴到Word文档中,保存3、有时可能要去除多余表格和对一些丢失的图片进行处理。
去除多余表格的技巧一般有:1、只要文字部分的,可以先复制到Notepad(记事本)中,再复制粘贴到知识点的Word文档中2、要保留格式的,要看看内容是由几个单元格组成,可以一次剪切一个单元格的内容到表格外,最后再删除表格即可丢失的图片处理:1、可尝试将网页保存到本地,然后从本地打开网页;这样处理后可解决大部分图片丢失问题2、用右键将一个个将网页的图片保存到本地,再插入知识点的Word文档中更多参考:在网上查到可用的资料,你可以先选中所需的内容,然后执行复制操作,在打开的Word文档中执行粘贴命令。
复制的内容一般有这样几种情况:纯文字、带有表格的文本和图文混排。
针对不同的内容及你的需要,应采取不同的处理方法,以达到满意的效果。
一、纯文字内容如果复制的内容是纯文字形式,无表格与图片,且你愿意保留HTML文档中的格式及链接等,直接单击工具栏上的“粘贴”按钮就可以了,网页文字上原有的属性都会保留下来。
但这时文档往往显得比较杂乱,需要重新编辑、排版,对其字号、字体、字形及行间距、对齐方式等进行重新设置。
在许多情况下文档中会出现大量的“手工换行符(箭头向下的符号)”,如果你采用删除后再回车加上段落标记的方法来处理,对于长文档来说是很费时的,这时你可以应用Word的“查找/替换”功能来轻松解决。
在“查找/替换”对话框中,打开“高级”选项,在“查找内容”框中加上“^I”(手工换行符),在“替换为”框中加上“^p”(段落标记),只要再单击“全部替换”按钮,瞬间就完成替换操作。
在有的文档中有两个“手工换行符”,这时只要在“查找内容”框中加上“^I^I”(两个手工换行符),再执行“全部替换”操作就可以了。
如果你不需要保留原来的格式及链接等,单击“编辑→选择性粘贴”,打开“选择性粘贴”对话框,在“粘贴”选项中选择“无格式文本”,确定就可以了。
这样复制后的文本不带有任何格式,略做处理即可。
如果你用的是Word 2002,那就更方便了,直接单击工具栏上的“粘贴”按钮,此时复制的文本是带有格式的,但在复制文本的右下角有一个“选择粘贴”按钮,单击此按钮菜单的“仅保留文本”命令,你的文本立即转化为无格式的文本了。
经过上面的处理,你的文档中还有许多的无用空格的呢,可以再利用一下“查找/替换”功能删除干净。
二、带有表格的文本有时我们从网页上复制的内容是带有表格的,这为排版带来了很大的麻烦,这时我们可以把表格去掉。
你只要将光标移动到表格内的任一位置,单击“表格→转换→表格转换成文本”,弹出一个“表格转换成文本”对话框,再选择“段落标记”或“制表符”等文字分隔符,确定后,表格消失了,而文字完整保留下来,并且文字的格式及链接等都保留着。
如果你只需要其文字内容,不想保留有关格式及链接等,利用“选择性粘贴”命令就能解决问题了。
三、图文混排形式对于图文并茂的网页,复制到Word后,默认的图文环绕方式是“嵌入型”,一般还要对文档进行排版,对“文字格式”和“段落格式”进行设置。
在利用“段落对话框”设置行间距时,下拉列表中提供了“倍距”、“最小值”、“固定值”几个选项,在此特别提醒你不要选择“固定值”选项。
如果选择后,图片会置于文字的下面,被遮盖住,需要将图文环绕方式重新设置为“四周型”等环绕方式,图片才能完全显示出来。
将图文复制后,图片与文本的相对位置会发生一定的变化,有时为了某种特殊的需要,欲保持图片与文本的相对位置绝对不改变。
html里怎么打开word文档格式
你说的是网页上在线编辑Word吧。
知道的方案有几种。
1)采用网页插件,比如PageOffice,webOffice,这种方案实际是调用本地Office进行编辑,确切的说是网页编辑而非在线编辑。
需要安装插件,客户端必须是windows,容易发生兼容性问题。
2)采用微软的OWA,这个是网页版的Office,好处确实是原生的Office,缺点是网页版功能比本地版本弱,开发难以得到微软的支持,坑很多,碰到了也不知道怎么解决。
与之接近的是一起写,石墨这样的类Office编辑,这个就不是原生office格式,是格式转换后的在线编辑,还有就是类word编辑相对完善,而excel,ppt这些就差很多了。
3)采用UZER.ME的SDK,UZER.ME支持网页内无插件使用各种原生应用,当然也包括office,本地也无需安装Office,全平台支持。
缺点是需要服务器资源较多。
如何在网页中直接打开word文件
已找到解决方法,打开我的电脑--工具--文件夹选项--文件类型,在已注册的文件类型里单击“扩展名DOC”一行,点击下面的“高级”,在窗口中将“在同一窗口中浏览”选项前的勾去掉,只保留“下载后确认打开”选项前的勾,点确定--关闭,再打开那个链接的时候就好了,直接调用word打开了。
转载请注明出处51数据库 » 网页用word文档怎么打开
时间-problem