java读取word文档 java直接显示word文档

java读取word文件的问题

请贴出代码，谢谢。

请关闭输入流，释放资源，谢谢。

调用close（)方法。

其他貌似没有发现什么问题。

public static String run(String filename){WordExtractor extractor=null;String text=null;try{FileInputStream in = new FileInputStream (filename);extractor = new WordExtractor();text=extractor.extractText(in);}catch(Exception ex){//logreturn null;}return text;}public static void main(String[] args){try{FileOutputStream out=new FileOutputStream(＂result.txt＂);out.write(WordProcess.run(args[0]).getBytes());out.flush();out.close();}catch(Exception ex){System.out.println(ex.toString());}}看看这个。

模范这样写，试试看。

这个代码我试过，没问题，如果这样写还是有问题，那就不是代码的问题了。

JAVA读取WORD,EXCEL,PDF文件的方法是什么呢？

JAVA读取WORD,EXCEL,POWERPOINT,PDF文件的方法 OFFICE文档使用POI控件，PDF可以使用PDFBOX0.7.3控件，完全支持中文，用XPDF也行，不过感觉PDFBOX比较好，而且作者也在更新。

水平有限，万望各位指正 WORD: import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org.apache.poi.hwpf.extractor.WordExtractor; import java.io.File; import java.io.InputStream; import java.io.FileInputStream; import com.search.code.Index; public Document getDocument(Index index, String url, String title, InputStream is) throws DocCenterException { String bodyText = null; try { WordExtractor ex = new WordExtractor(is);//is是WORD文件的InputStream bodyText = ex.getText(); if(!bodyText.equals(＂＂)){ index.AddIndex(url, title, bodyText); } }catch (DocCenterException e) { throw new DocCenterException（＂无法从该Mocriosoft Word文档中提取内容＂， e）; }catch(Exception e){ e.printStackTrace(); } } return null; } Excel: import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org.apache.poi.hwpf.extractor.WordExtractor; import org.apache.poi.hssf.usermodel.HSSFWorkbook; import org.apache.poi.hssf.usermodel.HSSFSheet; import org.apache.poi.hssf.usermodel.HSSFRow; import org.apache.poi.hssf.usermodel.HSSFCell; import java.io.File; import java.io.InputStream; import java.io.FileInputStream; import com.search.code.Index; public Document getDocument(Index index, String url, String title, InputStream is) throws DocCenterException { StringBuffer content = new StringBuffer(); try{

怎么使用JAVA,POI读写word文档

如何使用JAVA、POI读写word文档？？能不能将一个word的内容完全读过来，放到一个新生成的word文件中去，要求能将word中的表格、图片等保留，格式不变。

最好能给个例子？网上多是很早以前的那个解决方法如下：，只能读文本内容，且新生成的word文件打开时总是要提示选择编码，不太好用，希望能有新的解决方案？？！！poi操作word1.1 添加poi支持：包下载地址1.2 POI对Excel文件的读取操作比较方便，POI还提供对Word的DOC格式文件的读取。

但在它的发行版本中没有发布对Word支持的模块，需要另外下载一个POI的扩展的Jar包。

下载地址为；下载extractors-0.4_zip这个文件2、提取Doc文件内容 public static String readDoc(String doc) throws Exception {// 创建输入流读取DOC文件 FileInputStream in = new FileInputStream(new File(doc)); WordExtractor extractor = null; String text = null；// 创建WordExtractor extractor = new WordExtractor（)；// 对DOC文件进行提取 text = extractor.extractText(in); return text; } public static void main(String[] args) { try{ String text = WordReader.readDoc(＂c:/test.doc＂); System.out.println(text); }catch(Exception e){ e.printStackTrace(); } }3、写入Doc文档 import java.io.ByteArrayInputStream; import java.io.FileOutputStream; import java.io.IOException; import org.apache.poi.poifs.filesystem.DirectoryEntry; import org.apache.poi.poifs.filesystem.DocumentEntry; import org.apache.poi.poifs.filesystem.POIFSFileSystem; public class WordWriter { public static boolean writeDoc(String path, String content) { boolean w = false; try { // byte b[] = content.getBytes(＂ISO-8859-1＂); byte b[] = content.getBytes(); ByteArrayInputStream bais = new ByteArrayInputStream(b); POIFSFileSystem fs = new POIFSFileSystem(); DirectoryEntry directory = fs.getRoot(); DocumentEntry de = directory.createDocument(＂WordDocument＂, bais); FileOutputStream ostream = new FileOutputStream(path); fs.writeFilesystem(ostream); bais.close(); ostream.close(); } catch (IOException e) { e.printStackTrace(); } return w; } public static void main(String[] args) throws Exception{ String wr=WordReader.readDoc(＂D:\\test.doc＂); boolean b = writeDoc(＂D:\\result.doc＂,wr);

Java读取数据库打印到word文档问题求教各位大侠,java写

为什么非要写道word文档中？你可以写进txt文件中，然后使用word进行编辑如果确实需要，请看下面的例子： import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import org.apache.poi.hwpf.extractor.WordExtractor; import org.apache.poi.hwpf.model.io.HWPFOutputStream; public class Word { /** * 读取纯文本的word文件 */ public String readWord(String doc) throws Exception { String context = null; WordExtractor extractor = null； //纯文本的遍历器 try { FileInputStream in = new FileInputStream(new File(doc)); extractor = new WordExtractor(in); context = extractor.getText(); } catch (Exception e) { e.printStackTrace(); } return context； } /** * 对word文档做写操作 * */ public boolean writeWord(String path, String content) throws Exception { boolean w = false; try { byte b[] = content.getBytes(); FileOutputStream fs = new FileOutputStream(path); HWPFOutputStream hos = new HWPFOutputStream(); hos.write(b, 0, b.length); hos.writeTo(fs); hos.close(); w=true; } catch (Exception e) { e.printStackTrace(); } return w; } public static void main(String[] args) { ReadWord rw = new ReadWord(); try{ String text = rw.readDoc(＂D:\\workspace\\MyUntil\\t.doc＂); rw.writeDoc(＂D:\\workspace\\MyUntil\\d.doc＂, text); }catch(Exception e){ e.printStackTrace（)； } } } 所需的包请各位自己上apache的官网上poi工程目录下下吧 poi-3.5-final poi-contrib-3.5-final poi-ooxml-3.5-final poi-scratchpad-3.5-final

java 读取office文档

OFFICE文档使用POI控件，PDF可以使用PDFBOX0.7.3控件，完全支持中文，用XPDF也行，不过感觉PDFBOX比较好，而且作者也在更新。

水平有限，万望各位指正WORD:import org.apache.lucene.document.Document;import org.apache.lucene.document.Field;import org.apache.poi.hwpf.extractor.WordExtractor;import java.io.File;import java.io.InputStream;import java.io.FileInputStream;import com.search.code.Index;public Document getDocument(Index index, String url, String title, InputStream is) throws DocCenterException {String bodyText = null;try {WordExtractor ex = new WordExtractor(is);//is是WORD文件的InputStream bodyText = ex.getText();if(!bodyText.equals(＂＂)){index.AddIndex(url, title, bodyText);}}catch (DocCenterException e) {throw new DocCenterException（＂无法从该Mocriosoft Word文档中提取内容＂， e）;}catch(Exception e){e.printStackTrace();}}return null;}Excel:import org.apache.lucene.document.Document;import org.apache.lucene.document.Field;import org.apache.poi.hwpf.extractor.WordExtractor;import org.apache.poi.hssf.usermodel.HSSFWorkbook; import org.apache.poi.hssf.usermodel.HSSFSheet; import org.apache.poi.hssf.usermodel.HSSFRow; import org.apache.poi.hssf.usermodel.HSSFCell; import java.io.File;import java.io.InputStream;import java.io.FileInputStream;import com.search.code.Index;public Document getDocument(Index index, String url, String title, InputStream is) throws DocCenterException {StringBuffer content = new StringBuffer();try{HSSFWorkbook workbook = new HSSFWorkbook(is)；//创建对Excel工作簿文件的引用 for (int numSheets = 0; numSheets这样可以么？

怎样才能把word文件读取并显示在java中？请各位指教！

经过一番选择还是折中点采用rtf最好，毕竟rtf是开源格式java读取word文档时，虽然网上介绍了很多插件poi，各种格式都可以设定、java2Word，不需要借助任何插件，去他们论坛找高人解决也说不出原因，项目部署用它有点玄；itxt好像写很方便但是我查了好久资料没有见到过关于读的好法，操作方法完全一致，有的机器不报错，有的报错，比较诡异，我曾经在不同的机器上试过，做项目不太敢用）；java2Word、jacob容易报错找不到注册，poi无法读取格式（新的API估计行好像还在处于研发阶段，不太稳定、itext等等、jacob，只需基本IO操作外加编码转换即可。

rtf格式文件表面看来和doc没啥区别，都可以用word打开。

具体代码可以参考：/...

java 怎么读取服务器上的word文件中的内容

通过流来读取，例如：TextFileForm fileForm = (TextFileForm) form; FormFile formFile = fileForm.getTxtFile(); if (formFile.getFileData().length == 0) { response.setCharacterEncoding(＂gb2312＂); response.getWriter().write(＂＂); } InputStream in = formFile.getInputStream(); WordExtractor extractor = new WordExtractor(); String str = extractor.extractText(in)；这段代码就是负责读取word的

java解析word文档有哪些方法

java读取word文档时，虽然网上介绍了很多插件poi、java2Word、jacob、itext等等，poi无法读取格式（新的API估计行好像还在处于研发阶段，不太稳定，做项目不太敢用）；java2Word、jacob容易报错找不到注册，比较诡异，我曾经在不同的机器上试过，操作方法完全一致，有的机器不报错，有的报错，去他们论坛找高人解决也说不出原因，项目部署用它有点玄；itxt好像写很方便但是我查了好久资料没有见到过关于读的好办法。

经过一番选择还是折中点采用rtf最好，毕竟rtf是开源格式，不需要借助任何插件，只需基本IO操作外加编码转换即可。

rtf格式文件表面看来和doc没啥区别，都可以用word打开，各种格式都可以设定。

----- 实现的功能：读取rtf模板内容（格式和文本内容），替换变化部分，形成新的rtf文档。

----- 实现思路：模板中固定部分手动输入，变化的部分用$info$表示，只需替换$info$即可。

1、采用字节的形式读取rtf模板内容2、将可变的内容字符串转为rtf编码3、替换原文中的可变部分，形成新的rtf文档主要程序如下：public String bin2hex(String bin) {char[] digital = ＂0123456789ABCDEF＂.toCharArray();StringBuffer sb = new StringBuffer(＂＂);byte[] bs = bin.getBytes();int bit;for (int i = 0; i > 4;sb.append(＂\\'＂);sb.append(digital[bit]);bit = bs[i] & 0x0f;sb.append(digital[bit]);}return sb.toString(); }public String readByteRtf(InputStream ins, String path){ String sourcecontent =＂＂; try{ ins = newFileInputStream(path); byte[] b= new byte[1024];if (ins == null) {System.out.println（＂源模板文件不存在＂）；}int bytesRead = 0;while (true) {bytesRead = ins.read(b, 0, 1024); // return final read bytescountsif(bytesRead == -1) {// end of InputStreamSystem.out.println（＂读取模板文件结束＂）；break;}sourcecontent += new String(b, 0, bytesRead); // convert to stringusing bytes} }catch(Exception e){ e.printStackTrace(); } return sourcecontent ；}以上为核心代码，剩余部分就是替换，从新组装java中的String.replace(oldstr,newstr)；方法可以实现，在这就不贴了。

源代码部分详见附件。

运行源代码前提：c盘创建YQ目录，将附件中＂模板.rtf＂复制到YQ目录之下，运行OpreatorRTF.java文件即可，就会在YQ目录下生成文件名如：21时15分19秒_cheney_记录.rtf的文件。

package com;import java.io.File;import java.io.FileInputStream;import java.io.FileWriter;import java.io.IOException;import java.io.InputStream;import java.io.PrintWriter;import java.text.SimpleDateFormat;import java.util.Date;public class OperatorRTF {public String strToRtf(String content){char[] digital = ＂0123456789ABCDEF＂.toCharArray();StringBuffer sb = new StringBuffer(＂＂);byte[] bs = content.getBytes();int bit;for (int i = 0; i > 4;sb.append(＂\\'＂);sb.append(digital[bit]);bit = bs[i] & 0x0f;sb.append(digital[bit]);}return sb.toString();}public String replaceRTF(String content,String replacecontent,intflag){String rc = strToRtf(replacecontent);String target = ＂＂;if(flag==0){target = content.replace(＂$timetop$＂,rc);}if(flag==1){target = content.replace(＂$info$＂,rc);}if(flag==2){target = content.replace(＂$idea$＂,rc);}if(flag==3){target = content.replace(＂$advice$＂,rc);}if(flag==4){target = content.replace(＂$infosend$＂,rc);}return target;}public String getSavePath() {String path = ＂C:\\YQ＂;File fDirecotry = new File(path);if (!fDirecotry.exists()) {fDirecotry.mkdirs();}return path;}public String ToSBC(String input){char[] c =input.toCharArray();for (int i =0; i < c.length; i++){if (c[i] == 32){c[i] = (char) 12288;continue;}if (c[i] < 127){c[i] = (char) (c[i] + 65248);}}return newString(c);}public void rgModel(String username, String content) {// TODO Auto-generated method stubDate current=new Date();SimpleDateFormat sdf=new java.text.SimpleDateFormat(＂yyyy-MM-ddHH:mm:ss＂);String targetname = sdf.format(current).substring(11,13) + ＂时＂；targetname += sdf.format(current).substring(14,16) + ＂分＂；targetname += sdf.format(current).substring(17,19) + ＂秒＂；targetname += ＂_＂ + username +＂_记录.rtf＂;String strpath = getSavePath();String sourname = strpath+＂\\＂+＂模板.rtf＂;String sourcecontent = ＂＂;InputStream ins = null;try{ins = new FileInputStream(sourname);byte[] b = new byte[1024];if (ins == null) {System.out.println（＂源模板文件不存在＂）；}int bytesRead = 0;while (true) {bytesRead = ins.read(b, 0, 1024); // return final read bytescountsif(bytesRead == -1) {// end of InputStreamSystem.out.println（＂读取模板文件结束＂）；break;}sourcecontent += new Strin...

转载请注明出处51数据库 » java读取word文档