java 怎么读取服务器上的word文件中的内容
通过流来读取,例如:TextFileForm fileForm = (TextFileForm) form; FormFile formFile = fileForm.getTxtFile(); if (formFile.getFileData().length == 0) { response.setCharacterEncoding("gb2312"); response.getWriter().write(""); } InputStream in = formFile.getInputStream(); WordExtractor extractor = new WordExtractor(); String str = extractor.extractText(in);这段代码就是负责读取word的
如何读取服务器上文件的绝对路径
将Word转Html的原理是这样的:1、客户上传Word文档到服务器2、服务器调用OpenOffice程序打开上传的Word文档3、OpenOffice将Word文档另存为Html格式4、Over至此可见,这要求服务器端安装OpenOffice软件,其实也可以是MS Office,不过OpenOffice的优势是跨平台,你懂的。
恩,说明一下,本文的测试基于 MS Win7 Ultimate X64 系统。
下面就是规规矩矩的实现。
1、下载OpenOffice,2、下载Jodconverter 这是一个开启OpenOffice进行格式转化的第三方jar包。
3、泡杯热茶,等待下载。
4、安装OpenOffice,安装结束后,调用cmd,启动OpenOffice的一项服务:C:\Program Files (x86)\OpenOffice.org 3\program>soffice -headless -accept="socket,port=8100;urp;"5、打开eclipse6、喝杯热茶,等待eclipse打开。
7、新建eclipse项目,导入Jodconverter/lib 下得jar包。
* commons-io * jodconverter * juh * jurt * ridl * slf4j-api * slf4j-jdk14 * unoil * xstream 8、Coding...查看代码package com.mzule.doc2html.util;import java.io.BufferedReader;import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.IOException;import java.io.InputStreamReader;import java.net.ConnectException;import java.util.Date;import java.util.regex.Matcher;import java.util.regex.Pattern;import com.artofsolving.jodconverter.DocumentConverter;import com.artofsolving.jodconverter.openoffice.connection.OpenOfficeConnection;import com.artofsolving.jodconverter.openoffice.connection.SocketOpenOfficeConnection;import com.artofsolving.jodconverter.openoffice.converter.OpenOfficeDocumentConverter;/** * 将Word文档转换成html字符串的工具类 * * @author MZULE * */public class Doc2Html { public static void main(String[] args) { System.out .println(toHtmlString(new File("C:/test/test.doc"), "C:/test")); } /** * 将word文档转换成html文档 * * @param docFile * 需要转换的word文档 * @param filepath * 转换之后html的存放路径 * @return 转换之后的html文件 */ public static File convert(File docFile, String filepath) { // 创建保存html的文件 File htmlFile = new File(filepath + "/" + new Date().getTime() + ".html"); // 创建Openoffice连接 OpenOfficeConnection con = new SocketOpenOfficeConnection(8100); try { // 连接 con.connect(); } catch (ConnectException e) { System.out.println("获取OpenOffice连接失败..."); e.printStackTrace(); } // 创建转换器 DocumentConverter converter = new OpenOfficeDocumentConverter(con); // 转换文档问html converter.convert(docFile, htmlFile); // 关闭openoffice连接 con.disconnect(); return htmlFile; } /** * 将word转换成html文件,并且获取html文件代码。
* * @param docFile * 需要转换的文档 * @param filepath * 文档中图片的保存位置 * @return 转换成功的html代码 */ public static String toHtmlString(File docFile, String filepath) { // 转换word文档 File htmlFile = convert(docFile, filepath); // 获取html文件流 StringBuffer htmlSb = new StringBuffer(); try { BufferedReader br = new BufferedReader(new InputStreamReader( new FileInputStream(htmlFile))); while (br.ready()) { htmlSb.append(br.readLine()); } br.close(); // 删除临时文件 htmlFile.delete(); } catch (FileNotFoundException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } // HTML文件字符串 String htmlStr = htmlSb.toString(); // 返回经过清洁的html文本 return clearFormat(htmlStr, filepath); } /** * 清除一些不需要的html标记 * * @param htmlStr * 带有复杂html标记的html语句 * @return 去除了不需要html标记的语句 */ protected static String clearFormat(String htmlStr, String docImgPath) { // 获取body内容的正则 String bodyReg = ""; Pattern bodyPattern = Pattern.compile(bodyReg); Matcher bodyMatcher = bodyPattern.matcher(htmlStr); if (bodyMatcher.find()) { // 获取BODY内容,并转化BODY标签为DIV htmlStr = bodyMatcher.group().replaceFirst("", ""); } // 调整图片地址 htmlStr = htmlStr.replaceAll("转换成保留样式 // content = content.replaceAll("(]*>.*?)()", // ""); // 把转换成并删除样式 htmlStr = htmlStr.replaceAll("(]*)(>.*?)()", ""); // 删除不需要的标签 htmlStr = htmlStr .replaceAll( "]*?>", ""); // 删除不需要的属性 htmlStr = htmlStr .replaceAll( "]*)(?:lang|LANG|class|CLASS|style|STYLE|size|SIZE|face|FACE|[ovwxpOVWXP]:\\w+)=(?:'[^']*'|\"\"[^\"\"]*\"\"|[^>]+)([^>]*)>", ""); return htmlStr; }}
php 怎么实现读取word文档内容,显示到html上面?能给个案例最好...
//将文档中需要换的变量更换一下 $test=str_replace("";$word-> // 关闭与COM组件之间的连接 OPen("d:\a;br>);$test"); // 显示目前正在使用的Word的版本号 //echo "//读取文档内容 $test= $word->$word->.application") or die(" echo " //打?一个文档 br>:/myweb/comtest.doc"这是变量" $word->Documents->Add(); // 在新文档中添加文字 $word->Selection->TypeText("Version}SaveAs(" $word->" echo $test;Can'Loading Word, v;Visible = 0;// to open the application in the forefront;//把文档保存在目录中  .doc"); ActiveDocument->content->Text;,$test)," //$word->"t start Word!"); echo $test, use 1 (true) Documents->// 把它的可见性设置为0(假),如果要使它在最前端打开,使用1(真)  如果在win可以用com组件读取: // 建立一个指向新COM组件的索引 $word = new COM("word;Quit();   ...
java 读取服务器上的文件
public class NewClass { public static void main(String[] args) { JFrame frame = new JFrame(); final JTextArea p = new JTextArea(); try { URL url = new URL("http://download.oracle.com/javase/tutorial/uiswing/examples/components/CheckBoxDemoProject/src/components/CheckBoxDemo.java"); URLConnection con = url.openConnection(); InputStream stream = con.getInputStream(); byte bs[] = new byte[con.getContentLength()]; stream.read(bs); p.setText(new String(bs)); } catch (Exception ex) { Exceptions.printStackTrace(ex); } frame.getContentPane().add(new JScrollPane(p), BorderLayout.CENTER); frame.setDefaultCloseOperation(3); frame.setVisible(true); }}创建URL打开链接,获得流读写就完事了。
我这个打开的是java服务器上的java文件,和你那个txt文件一样,不过你要确保这个文件能够通过http打开。
word文档账户和服务器是什么
如果要查看文件夹的内容, 您可以直接单击阿里云邮箱页面左侧导航栏上“文件夹”旁的“管理文件夹”(小扳手符号),在接下来的页面中,您可以看到所有文件夹名称、占用空间、以及各文件夹内总邮件未读邮件的信件数量。
阿里云邮箱如何查看文件夹的详细内容 当您在查看文件夹的内容时,请点击该文件夹名称的链接,文件夹中信件将自动按照发送时间降序排列。
如果您想将信件作分类整理,请按以下步骤操作: 1、如果您想把文件夹中信件改为按照邮件的发送日期升序排列,请点击“时间” 链接,此时“时间”链接旁边箭头按钮变为向上,表示已经按照邮件的发送日期进行了升序排列。
2、按发件人排序,点击“发件人”的链接,用同样的办法,也可以按主题进行排序。
阿里云邮箱如何查看文件夹的详细内容 3、如果您想在信件到达时自动分类到不同的文件夹中,请使用阿里云邮箱的“过滤器”功能:点击页面右上角的“邮箱设置”,在“过滤器”中进行设置。
麻烦好评,谢谢
转载请注明出处51数据库 » 服务器读取word文档