如何利用iText文档转换为PDF文件
展开全部可以使用虚拟打印机来处理:方法一:使用虚拟打印机pdf factory即可,而且其他格式文件只要是能够打印,选择这个虚拟打印机,都可以做成PDF文件,很简单实用;方法二:用其他虚拟打印机转成PDF文件。
方法三:使用专门的转换软件,把文件转成PDF文件。
...
怎样用iText读取pdf文件
用iText读取pdf文件举例:(1)在Eclipse中新建一个Java工程。
(2)下载相应的iText-5.0.2.jar并放到对应的lib目录下。
在工程中创建包并创建测试类,该类包含一个inspect方法用于从一个PDF中获取文本,它接受两个参数,分别是PDF文件路径和输出流,指定要提取的PDF文件的路径和读取PDF所用的输出流,比如:PDF路径为E://text.pdf。
然后调用iText提供的PdfReader类和PdfTextExtractor类,将PDF格式的文本提取出来并写入txt文件中。
部分代码如下:import java.io.FileOutputStream; import java.io.IOException; import java.io.PrintWriter; import com.itextpdf.text.DocumentException; import com.itextpdf.text.pdf.PdfReader; import com.itextpdf.text.pdf.parser.PdfTextExtractor; public class PDF { /** The resulting text file with info about a PDF. */ public static final String RESULT = "d:/ceshi.txt";//存放由pdf转换成txt文件的路径。
/** * Main method. * @param args no arguments needed * @throws DocumentException * @throws IOException */ public st...pdf文件路径 inspect(writer;// import com.close().flush().parser.pdf:/读取第i页的文档内容 } writer;; /text;:(1)在Eclipse中新建一个Java工程.io.itextpdf;/获得页数 String content = ""/.pdf" } /.FileOutputStream;/, IOException { PrintWriter writer = new PrintWriter(new FileOutputStream(RESULT))。
(2)下载相应的iText-5; /.IOException.txt",比如; import java;/.0,string); i++) { content += PdfTextExtractor;存放读取出的文档内容 for (int i = 1.2,分别是PDF文件路径和输出流; import java:/:PDF路径为E.DocumentException;text; import com;/.jar并放到对应的lib目录下.PrintWriter.text。
/E.write(content).getTextFromPage(reader.text; / public static final String RESULT = ".getNumberOfPages(); import com。
在工程中创建包并创建测试类.itextpdf,该类包含一个inspect方法用于从一个PDF中获取文本;** * Inspect a PDF file and write the info to a txt file * @param writer Writer to a text file * @param filename Path to the PDF file * @throws IOException *//.PdfReader;ceshi,指定要提取的PDF文件的路径和读取PDF所用的输出流,它接受两个参数. * @param args no arguments needed * @throws DocumentException * @throws IOException */.text; /. */读取pdf所使用的输出流 int num = reader:import java.itextpdf;txt文件写入流 String string = ".pdf;/.io; num;/ public static void inspect(PrintWriter writer。
然后调用iText提供的PdfReader类和PdfTextExtractor类,将PDF格式的文本提取出来并写入txt文件中;d;/。
部分代码如下; public static void main(String[] args) throws DocumentException;/** The resulting text file with info about a PDF.io.pdf;** * Main method;调用读取方法 writer.PdfTextExtractor; i public class PDF { /, String filename) throws IOException { PdfReader reader = new PdfReader(filename)://存放由pdf转换成txt文件的路径;//, i);写入文件内容 writer用iText读取pdf文件举例
java使用itext生成word添加水印,不是pdf
写这些格式的文件,有相关的包。
pdf、word:我是用ITEXTexcel:用jxl去网上下他们的jar和帮助文档,一点不难哦,对了,这些组件其实对这些格式文件都有处理类,只是我觉得,他们都有自己最擅长的处理格式还有一个poi,用的也很多
如何将word文档转换成PDF文档
1.PDFFactory Pro虚拟打印机,安装后,在任何文档中,选择打印时,选择打印机为pdfFactoryPro,就能生成PDF文件,并可以进行安全设置。
2.SmartPrinter(Doc Pdf xls to pdf/tiff/bmp/jpg/png)一款大家非常熟悉的经典产品,专为转换文件而研发的高品质打印驱动,以运行稳定、转换速度快和图像质量高而著称,通过虚拟打印技术可以完美的将任意可打印文档转换成 PDF、TIFF、JPEG,BMP、PNG、EMF、GIF、TXT格式。
3.雪莹DocConvert虚拟打印转换。
雪莹DocConvert是一款文档转化工具,它通过虚拟打印的技术将任何文档转化为PDF,JPG,BMP,TIFF,PCX,PNG等等文档格式。
4.EasyPrint(虚拟打印机) V2.1,本软件实现的功能是把指定文档打印到文件,成为标准的BMP位图,实现无纸打印的功能。
主要应用在需要把一些文件打印后扫描再处理,或者一些需要打印效果的软件的插件。
例如:把WORD文件打印到BMP文件,然后进行处理 5、可以用金山的WPS软件安装后用来转换,还有可以用PDFtoWord软件进行转换
java中html怎么转换为可编辑pdf文件?
Java代码// step 1 Document document = new Document(); // step 2 PdfWriter writer = PdfWriter.getInstance(document, new FileOutputStream("pdf.pdf")); // step 3 document.open(); // step 4 XMLWorkerHelper.getInstance().parseXHtml(writer, document, new FileInputStream("index.html")); //step 5 document.close(); System.out.println( "PDF Created!" ); Maven构建对应的版本Xml代码com.itextpdfitextpdf5.4.2com.itextpdf.toolxmlworker5.4.1
java itext 创建pdf,直接返回输出流做成下载,怎么做
一、iText介绍 iText是着名的开放源码的站点sourceforge一个项目,是用于生成PDF文档的一个java类库。
通过iText不仅可以生成PDF或rtf的文档,而且可以将XML、Html文件转化为PDF文件。
iText的安装非常方便,在http://www.lowagie.com/iText/download.html - download 网站上下载iText.jar文件后,只需要在系统的CLASSPATH中加入iText.jar的路径,在程序中就可以使用iText类库了。
二、建立第一个PDF文档 用iText生成PDF文档需要5个步骤: ①建立com.lowagie.text.Document对象的实例。
Document document = new Document(); ②建立一个书写器(Writer)与document对象关联,通过书写器(Writer)可以将文档写入到磁盘中。
PDFWriter.getInstance(document, new FileOutputStream("Helloworld.PDF")); ③打开文档。
document.open(); ④向文档中添加内容。
document.add(new Paragraph("Hello World")); ⑤关闭文档。
document.close(); 通过上面的5个步骤,就能产生一个Helloworld.PDF的文件,文件内容为"Hello World"。
建立com.lowagie.text.Document对象的实例 com.lowagie.text.Document对象的构建函数有三个,分别是: public Document(); public Document(Rectangle pageSize); public Document(Rectangle pageSize, int marginLeft, int marginRight, int marginTop, int marginBottom); 构建函数的参数pageSize是文档页面的大小,对于第一个构建函数,页面的大小为A4,同Document(PageSize.A4)的效果一样;对于第三个构建函数,参数marginLeft、marginRight、marginTop、marginBottom分别为左、右、上、下的页边距。
通过参数pageSize可以设定页面大小、面背景色、以及页面横向/纵向等属性。
iText定义了A0-A10、AL、LETTER、 HALFLETTER、_11x17、LEDGER、NOTE、B0-B5、ARCH_A-ARCH_E、FLSA 和FLSE等纸张类型,也可以通过Rectangle pageSize = new Rectangle(144, 720);自定义纸张。
通过Rectangle方法rotate()可以将页面设置成横向。
书写器(Writer)对象 一旦文档(document)对象建立好之后,需要建立一个或多个书写器(Writer)对象与之关联。
通过书写器(Writer)对象可以将具体文档存盘成需要的格式,如com.lowagie.text.PDF.PDFWriter可以将文档存成PDF文件, com.lowagie.text.html.HtmlWriter可以将文档存成html文件。
设定文档属性 在文档打开之前,可以设定文档的标题、主题、作者、关键字、装订方式、创建者、生产者、创建日期等属性,调用的方法分别是: public boolean addTitle(String title) public boolean addSubject(String subject) public boolean addKeywords(String keywords) public boolean addAuthor(String author) public boolean addCreator(String creator) public boolean addProducer() public boolean addCreationDate() public boolean addHeader(String name, String content) 其中方法addHeader对于PDF文档无效,addHeader仅对html文档有效,用于添加文档的头信息。
当新的页面产生之前,可以设定页面的大小、书签、脚注(HeaderFooter)等信息,调用的方法是: public boolean setPageSize(Rectangle pageSize) public boolean add(Watermark watermark) public void removeWatermark() public void setHeader(HeaderFooter header) public void resetHeader() public void setFooter(HeaderFooter footer) public void resetFooter() public void resetPageCount() public void setPageCount(int pageN) 如果要设定第一页的页面属性,这些方法必须在文档打开之前调用。
对于PDF文档,iText还提供了文档的显示属性,通过调用书写器的setViewerPreferences方法可以控制文档打开时Acrobat Reader的显示属性,如是否单页显示、是否全屏显示、是否隐藏状态条等属性。
另外,iText也提供了对PDF文件的安全保护,通过书写器(Writer)的setEncryption方法,可以设定文档的用户口令、只读、可打印等属性。
添加文档内容 所有向文档添加的内容都是以对象为单位的,如Phrase、Paragraph、Table、Graphic对象等。
比较常用的是段落(Paragraph)对象,用于向文档中添加一段文字。
三、文本处理 iText中用文本块(Chunk)、短语(Phrase)和段落(paragraph)处理文本。
文本块(Chunk)是处理文本的最小单位,有一串带格式(包括字体、颜色、大小)的字符串组成。
如以下代码就是产生一个字体为HELVETICA、大小为10、带下划线的字符串: Chunk chunk1 = new Chunk("This text is underlined", FontFactory.getFont(FontFactory.HELVETICA, 12, Font.UNDERLINE)); 短语(Phrase)由一个或多个文本块(Chunk)组成,短语(Phrase)也可以设定字体,但对于其中以设定过字体的文本块 (Chunk)无效。
通过短语(Phrase)成员函数add可以将一个文本块(Chunk)加到短语(Phrase)中,如:phrase6.add(chunk); 段落(paragraph)由一个或多个文本块(Chunk)或短语(Phrase)组成,相当于WORD文档中的段落概念,同样可以设定段落的字体大小、颜色等属性。
另外也可以...
pdf格式转换成word
这里推荐一些PDF转换的方法,有pdf转word,pdf转txt,pdf转jpg,pdf转ppt,word转pdf等等相关的pdf转换器的方法:1.最简单,也是最有效的方法就是在线将pdf转换成你想要的文档,但有一个不好的地方是,现在的pdf文档都存储得有比较追求保密安全的,如果上传到网站上势必会影响文档的安全性,但是如果文档没有那么多的需求,还是比较实用的。
2.有很多相关的软件了,但大多数是国外的,这些软件将pdf文档中很多比较复杂的元素提取出来并对应的存储于目标文档的相关的元素,并且引用原pdf文档中的排版信息。
3.这里就想好好的介绍一下的相关的软件了,这里有一篇更详细的介绍免费使用的pdf相关转换的软件和在线转换的文章,希望能给你帮助:http://hi.baidu.com/%D8%FD%C8%BB/blog/item/8095f9d9a120b1fe39012fc5.html
微软的.xps格式文档如何转换成pdf或者word格式,xps to pdf ,xps to ...
您好1。
如果您安装有adobe acrobat专业版的话,把xps转为pdf很简单,adobe支持打开xps。
在xps文件>右键>打开方式,选择adobe打开,然后文件-另存为pdf即可。
2。
另行安装pdf虚拟打印机,如tiny pdf虚拟打印机,打开xps文件-打印-选择pdf打印机,就可生成新的pdf文件。
怎样把pdf格式转化为word文档
如何将PDF格式转化为WORD格式- -首先,pdf文档本身分为以下几类:1.非加密的pdf文档 这类文档是作者公开在网路上流行的文档,其内容是允许读者拷贝粘贴的,当然这其中要设计到合理的引用注释。
主要有两种类型,一个是编辑好的可以对文字部分操作的文档,另外一种是扫描格式的。
对于前一种文档adobe公司出品的pdf阅读和编辑软件都可以对文字部分进行选取,拷贝和粘贴,当然图片部分也可以。
通常我们写文章需要引用或编辑的时候,有选择的选取其中的文字就可以了,很方便,也没有必要全文选取。
当然,如果处于版面要求以及某种目的需要快速的全文转化,也是完全可以实现的。
主要方法包括:a. Adobe公司出品的pdf创建和编辑软件Adobe Acrobat(不是reader)本身就具有将pdf文档转化为word文档的能力。
只要我们打开菜单栏,将文档另存为doc格式或rtf格式就可以了。
但是说实话,这种方法得到的文档只能够说是变成了一堆字而已,原来的版式都没有了。
不过这也不失为一种方法。
b. 借助于其它软件实现高质量的pdf文档向word文档的转换。
其实现在能够实现这种功能的软件很多,我只介绍其中的两个,而这两个也绝对是具有业界领先水平的。
它们是Scansoft公司出品的Scansoft PDF Converter和ABBYY公司出品的ABBYY PDFTransformer。
当然后者作为OCR领域的业界大企业,还有一些具有此功能的更高级的软件,但是这个已经足以应付大部分的转换了。
这两个软件能够快速实现对于可拷贝的pdf文档的迅速转化,而且绝对是高质量的全文转换。
经过转换得到的word文档,排版和原来的pdf文档几乎没有分别,绝对是让你震惊的水准,需要全文转换的绝对推荐使用!c. 对于非加密扫描型pdf文档来说,其上面包含的文字实际上是属于图片的一部分,我们如果想大量的一次性得到这些文字,必须借助于OCR软件的辅助,这种软件种类繁多,中文外文的都有。
当然,对于英文的识别效率应该好于对于中文的,这也和选择的软件关系很大。
而且,最重要的是,pdf文档中文字的清晰度。
2.加密型pdf文档 加密型pdf文档通常不允许读者对其进行任何拷贝和编辑,包括其中的文字和图片。
这也是对版权的保护。
如果你非要违背作者意图来获得其中的文字,使用的方法主要有两种:第一就是借助于pdf加密破解软件,第二种就是手动往电脑里面敲吧。
推荐后者,毕竟该尊重的一定要尊重。
转载请注明出处51数据库 » itext word to pdf