如何用纯java代码实现word转pdf
展开全部 1:用apache pio 读取doc文件,然后转成html文件用Jsoup格式化html文件,最后用itext将html文件转成pdf。
2:使用jdoctopdf来实现,这是一个封装好的包,可以把doc转换成pdf,html,xml等格式,调用很方便。
3:地址http://www.maxstocker.com/jdoctopdf/downloads.php 需要注意中文字体的写入问题。
4:使用jodconverter来调用openOffice的服务来转换,openOffice有个各个平台的版本,所以这种方法跟方法1一样都是跨平台的。
jodconverter的下载地址:http://www.artofsolving.com/opensource/jodconverter 首先要安装openOffice,下载地址:office.org/download/index.html" target="_blank">http://www.openoffice.org/download/index.html 5:安装完后要启动openOffice的服务,具体启动方法请自行google。
6:效果最好的一种方法,但是需要window环境,而且速度是最慢的需要安装msofficeWord以及SaveAsPDFandXPS.exe(word的一个插件,用来把word转化为pdf) 7:Office版本是2007,因为SaveAsPDFandXPS是微软为office2007及以上版本开发的插件。
8:SaveAsPDFandXPS下载地址:microsoft.com/zh-cn/download/details.aspx?id=7" target="_blank">http://www.microsoft.com/zh-cn/download/details.aspx?id=7。
9:需要转换的工具 ,看你是linux还是word 。
word还好不需要安装。
linux就麻烦了。
爪哇是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由Sun Microsystems公司于1995年5月推出的Java程序设计语言和Java平台(即JavaEE, JavaME, JavaSE)的总称。
Java自面世后就非常流行,发展迅速,对C++语言形成了有力冲击。
Java技术具有卓越的通用性、高效性、平台移植性和安全性,广泛应用于个人PC、数据中心、游戏控制台、科学超级计算机、移动电话和互联网,同时拥有全球最大的开发者专业社群。
在全球云计算和移动互联网的产业环境下,Java更具备了显著优势和广阔前景。
如何用纯java代码实现word转pdf
1:用apache pio 读取doc文件,然后转成html文件用Jsoup格式化html文件,最后用itext将html文件转成pdf。
2:使用jdoctopdf来实现,这是一个封装好的包,可以把doc转换成pdf,html,xml等格式,调用很方便。
3:地址http://www.maxstocker.com/jdoctopdf/downloads.php需要注意中文字体的写入问题。
4:使用jodconverter来调用openOffice的服务来转换,openOffice有个各个平台的版本,所以这种方法跟方法1一样都是跨平台的。
jodconverter的下载地址:http://www.artofsolving.com/opensource/jodconverter首先要安装openOffice,下载地址:office.org/download/index.html" target="_blank">http://www.openoffice.org/download/index.html5:安装完后要启动openOffice的服务,具体启动方法请自行google。
6:效果最好的一种方法,但是需要window环境,而且速度是最慢的需要安装msofficeWord以及SaveAsPDFandXPS.exe(word的一个插件,用来把word转化为pdf)7:Office版本是2007,因为SaveAsPDFandXPS是微软为office2007及以上版本开发的插件。
8:SaveAsPDFandXPS下载地址:microsoft.com/zh-cn/download/details.aspx?id=7" target="_blank">http://www.microsoft.com/zh-cn/download/details.aspx?id=7。
9:需要转换的工具 ,看你是linux还是word 。
word还好不需要安装。
linux就麻烦了。
爪哇是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由Sun Microsystems公司于1995年5月推出的Java程序设计语言和Java平台(即JavaEE, JavaME, JavaSE)的总称。
Java自面世后就非常流行,发展迅速,对C++语言形成了有力冲击。
Java技术具有卓越的通用性、高效性、平台移植性和安全性,广泛应用于个人PC、数据中心、游戏控制台、科学超级计算机、移动电话和互联网,同时拥有全球最大的开发者专业社群。
在全球云计算和移动互联网的产业环境下,Java更具备了显著优势和广阔前景。
Java如何将Word文件转成PDF文件
用Java内嵌iText生成PDF文档需要5个步骤:①建立com.lowagie.text.Document对象的实例。
Document document = new Document();②建立一个书写器(Writer)与document对象关联,通过书写器(Writer)可以将文档写入到磁盘中。
PDFWriter.getInstance(document, new FileOutputStream("Helloworld.PDF"));③打开文档。
document.open();④向文档中添加内容。
document.add(new Paragraph("Hello World"));⑤关闭文档。
document.close();通过上面的5个步骤,就能产生一个Helloworld.PDF的文件,文件内容为"Hello World"。
java 带图片的word怎么转成pdf
adobe acrobat 7.0中已经带有PDF转WORD文档的功能,而且对保持原格式支持良好。
采用该软件,打开一份PDF文件,然后“另存为”word文档即可。
在Baidu中输入“adobe acrobat 7.0注册下载”搜索即可找到破解版的adobe acrobat 7.0下载。
另外,可以用ScanSoft PDF Converter效果也不错。
solid converter PDF也可以。
这三个软件我都实际用过,对中文支持好些的还是adobe acrobat 7.0。
但对格式支持好点的是ScanSoft PDF Converter。
这几个软件都可以在Baidu里搜索到注册版,你都可以安装试用,对不同文件转换的效果略有不同,根据你的PDF文件中图片多少选用最合适的软件即可。
PDF2Word v1.40 汉化修正版 Office 2003中也提供了文字识别服务,结合那个Image writer可以很方便将PDF转成WORD。
如何用java将pdf文件转换成word文件
需要用到插件jacob,自己去下载吧。
import com.jacob.activeX.ActiveXComponent;import com.jacob.com.ComThread;import com.jacob.com.Dispatch;import com.jacob.com.Variant;public class D2P {private ActiveXComponent wordCom = null;private Object wordDoc = null;private final Variant False = new Variant(false);private final Variant True = new Variant(true);/** *//** *//** *//*** 打开word文档** @param filePath* word文档* @return 返回word文档对象*/public boolean openWord(String filePath) {//建立ActiveX部件wordCom = new ActiveXComponent("Word.Application");try {//返回wrdCom.Documents的DispatchDispatch wrdDocs = wordCom.getProperty("Documents").toDispatch();//调用wrdCom.Documents.Open方法打开指定的word文档,返回wordDocwordDoc = Dispatch.invoke(wrdDocs, "Open", Dispatch.Method,new Object[] { filePath }, new int[1]).toDispatch();return true;} catch (Exception ex) {ex.printStackTrace();}return false;}/** *//** *//** *//*** 关闭word文档*/public void closeWord() {//关闭word文件wordCom.invoke("Quit", new Variant[] {});}/** *//** *//** *//*** * 将word文档打印为PS文件后,使用Distiller将PS文件转换为PDF文件 *** @param sourceFilePath* 源文件路径 ** @param destinPSFilePath* 首先生成的PS文件路径 ** @param destinPDFFilePath* 生成PDF文件路径*/public void docToPDF(String sourceFilePath, String destinPSFilePath,String destinPDFFilePath) {if (!openWord(sourceFilePath)) {closeWord();return;}//建立Adobe Distiller的com对象ActiveXComponent distiller = new ActiveXComponent("PDFDistiller.PDFDistiller.1");try {//设置当前使用的打印机,我的Adobe Distiller打印机名字为"Adobe PDF"wordCom.setProperty("ActivePrinter", new Variant("MS Publisher Color Printer"));//设置printout的参数,将word文档打印为postscript文档。
目前只使用了前5个参数,如果要使用更多的话可以参考MSDN的office开发相关api//是否在后台运行Variant Background = False;//是否追加打印Variant Append = False;//打印所有文档int wdPrintAllDocument = 0;Variant Range = new Variant(wdPrintAllDocument);//输出的postscript文件的路径Variant OutputFileName = new Variant(destinPSFilePath);Dispatch.callN((Dispatch) wordDoc, "PrintOut", new Variant[] {Background, Append, Range, OutputFileName });System.out.println("由word文档打印为ps文档成功!");//调用Distiller对象的FileToPDF方法所用的参数,详细内容参考Distiller Api手册//作为输入的ps文档路径Variant inputPostScriptFilePath = new Variant(destinPSFilePath);//作为输出的pdf文档的路径Variant outputPDFFilePath = new Variant(destinPDFFilePath);//定义FileToPDF方法要使用adobe pdf设置文件的路径,在这里没有赋值表示并不使用pdf配置文件Variant PDFOption = new Variant("");//调用FileToPDF方法将ps文档转换为pdf文档Dispatch.callN(distiller, "FileToPDF", new Variant[] {inputPostScriptFilePath, outputPDFFilePath, PDFOption });System.out.println("由ps文档转换为pdf文档成功!");} catch (Exception ex) {ex.printStackTrace();} finally {closeWord();wordCom=null;//释放在程序线程中引用的其它com,比如Adobe PDFDistillerComThread.Release();}}public static void main(String[] argv) {D2P d2p = new D2P();d2p.docToPDF("d:/12.doc", "d:/1p.ps", "d:/1p.pdf");//这里是你建一个叫12.doc的word文档,生成的文档将在D盘下//1p.ps和1p.pdf(这是我们要的)}}
普通WORD文档如何转化为PDF格式?
Adobe Acrobat制作PDF文档 PDF(Portable Document Format,便携文档格式)格式是Adobe公司在其PostScript语言的基础上创建的一种主要应用于电子出版的文件规范系统。
PDF文件可以将文字、字型、格式、颜色及与设备和分辨率独立的图形图像等封装在一个文件中,该格式文件还可以包含超文本链接、声音和动态影像等电子信息,支持特长文件,集成度和安全可靠性都较高。
由于PDF文件可以不依赖操作系统的语言和字体以及显示设备,就能“逼真地”将文件原貌展现给每一个阅读者,因此越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件等开始使用PDF格式文件。
目前已成为电子文档发行和数字化信息传播事实上的一个标准。
制作PDF文件的“官方”软件为Adobe公司的Adobe Acrobat,注意,不是我们通常使用的Adobe Acrobat Reader(这个软件只是pdf文件的阅读软件)。
Adobe Acrobat是一个商业软件,本文操作基于Adobe Acrobat 4.0,其他版本流程类似。
软件安装要点 首先是安装软件,不要觉得安装很简单,如果安装得不当是不能输出含有中文PDF文件的。
安装时需注意的地方在于看到如图1的对话框时,选择“Custom(用户定制)”方式,点Next继续,出现组件对话框,把滚动条拉到最末端,点中“Asian Language Support(支持亚洲语言)”,然后点“Change”按钮,在弹出的对话框里选择“Simplified Chinese Language Files(简体中文语言包)”和“Distiller Asian Language PDF Generation(Distiller亚洲语言PDF生成器)”,点“Continue”继续。
再点“Next”,只要输入个人信息和序列号,再一路Next就可以了,在拷贝完成后忽略电子注册,然后按照提示重新启动计算机就完成安装了。
这时候你打开Word就会发现多了两个图标,这可能是Acrobat的一个bug,我们先删去一个图标,右键点击工具栏,选择“自定义”,然后在“工具栏”标签中选中一个“PDFMaker 4.0”,点“删除”按钮即可。
在这里PDFMaker是一个宏按钮,是特别为Microsoft Word设计的,用来在Word中方便地生成PDF文件。
自动生成PDF文件 现在我们就可以来制作第一个PDF文件了。
首先,用Word打开一个文件,然后点击工具栏中的图标,会出现图2这样的对话框,使用系统的默认值就单击“Create”按钮,这样PDFMaker就开始自动生成PDF文件了。
它会自动扫描Word文档中的有关信息,比如链接、目录之类,把它们和PDF格式的链接、目录等相对应,在生成的PDF文件中的所有可视信息都和原来的文件相同。
还要说明一点,PDFMaker生成的PDF文件存放的路径与原来的DOC文件相同。
到这里,你已经做好了第一个PDF文件!这是最简单的一种方法,但不是最好的。
为什么呢?因为这样做出来的PDF文件尺寸非常大,比如原来的DOC文件只有25K,用上面这种方法做出来的文件有153K之巨!根本不符合网上传输的要求!可能你会问为什么会这样呢? 解释这个问题就要从PDF文件的内部制作过程讲起。
转换成PDF文件的过程非常特殊,在安装完Acrobat后,去查看打印机,会发现多了两个打印机设置Acrobat Distiller和Acrobat PDFWriter,这是Acrobat自动设置的虚拟打印机,这对制作PDF文件来说是必须的。
因为PDF文件的格式规范是创建在PostScript语言基础上的,而PostScript语言是一种精确的页面描述语言,应用在电子出版上来生成复杂的版面,PostScript与打印机的硬件无关,只要求打印机支持这种页面描述就可以了。
在这里Acrobat Distiller和Acrobat PDFWriter就是两个虚拟的PostScript打印机,而宏PDFMaker就是把DOC文档进行虚拟打印,得到中间文件?.PS(PostScript)文件,然后再调用Acrobat Distiller来产生PDF文件。
Acrobat为了适应亚洲语言的特点,对亚洲语言设计了特殊的生成器和语言包,但是它是通过“嵌入字体(Embed Fonts)”的方法来解决的。
这样做对于直接打印是很优化的,但是如果是用来生成PDF文件,带来的负面效应就是大大增加了文件的尺寸。
转载请注明出处51数据库 » java word转化pdf