如何使用apache poi将word转化为html
Java可以使用这个开源框架,对word进行读取合并等操作,Apache POI是一个开源的利用Java读写Excel、WORD等微软OLE2组件文档的项目。
最新的3.5版本有很多改进,加入了对采用OOXML格式的Office 2007支持,如xlsx、docx、pptx文档。
示例如下:import org.apache.poi.POITextExtractor; import org.apache.poi.hwpf.extractor.WordExtractor; //得到.doc文件提取器 org.apache.poi.hwpf.extractor.WordExtractor doc = new WordExtractor(new FileInputStream(filePath)); //提取.doc正文文本 String text = doc.getText(); //提取.doc批注 String[] comments = doc. getCommentsText(); 2007 import org.apache.poi.POITextExtractor; import org.apache.poi.xwpf.extractor.XWPFWordExtractor; import org.apache.poi.xwpf.usermodel.XWPFComment; import org.apache.poi.xwpf.usermodel.XWPFDocument; //得到.docx文件提取器 org.apache.poi.xwpf.extractor.XWPFWordExtractor docx = new XWPFWordExtractor(POIXMLDocument.openPackage(filePath)); //提取.docx正文文本 String text = docx.getText(); //提取.docx批注 org.apache.poi.xwpf.usermodel.XWPFComment[] comments = docx.getDocument()).getComments(); for(XWPFComment comment:comments){ comment.getId();//提取批注Id comment.getAuthor();//提取批注修改人 comment.getText();//提取批注内容 }
java POI html转word,无法显示图片
展开全部 html文件转换为word文件:打开这个文档,以桌面上随便一个word为例,就拿今天在军事网上看到的文章为例吧,打这个文件打开;打开这个word文件后,选择office菜单下面的另存为菜单 ,如图;在”另存为“的下拉菜单中选择最下面一个”其他格式“,如图;点击进去之后,在文件格式网页格式,然后再点保存就可以了;...
HTML文件怎么转换成Word文档。
打开 HTML 文件,点击菜单栏 文件→使用 Microsoft Office Word 编辑,之后系统会自动打开 Word 并显示HTML文件的内容,这是保存即可。
如果找不到“使用 Microsoft Office Word 编辑”的话,点击菜单栏 工具→Internet 选项→程序→ HTML 编辑器 → Microsoft Office Word → 确定。
怎么把html中的转换为word或者是pdf格式的文档
在word的打开文件的文件名处输入html的网址,即可 用WORD打开页面并进入编辑状态,你编辑后另存为DOC即可。
转换为PDF格式:1、如果你使用chrome预览,就比较简单了。
点打印,目标,选本地另存为pdf,即可。
2、如果你的浏览器有虚拟的PDF打印机的,请你PDF虚拟打印机打印你要输出的内容,即可得到你要的PDF文档。
3、如果用其它浏览器,没有虚拟的PDF打印机的,请你安装Adobe Acrobat XI Pro软件,用Adobe PDF打印机打印你要输出的内容,即可得到你要的PDF文档。
将Word文档转换为HTML网页文件,怎样操作?
1. 打开word文档,单击菜单栏中的“文件”,找到“另存为” 或“另存为网页”2. 单击另存为” 或“另存为网页”,弹出"另存为" 窗口3. 在"另存为" 窗口的“保存类型”,下拉菜单中找到“网页”。
4. 在“文件名”一栏中可以修改我们想要的文件名5. 点“保存”,就把一篇word文档保存成网页格式了。
6. 这时候在桌面就可以找到保存的网页,然后用浏览器会打开并显示网页的内容。
转载请注明出处51数据库 » poi将html转换为word文档