python3 word to pdf

请教在python3中安装pdfminer.six的方法

正确的安装方法是输入：setup.py install以下是详细步骤：第一步：下载pdfminerhttps://pypi.python.org/pypi/pdfminer/点击download第二步：安装pdfminer将下载好的pdfminer解压到D：或其他合适的盘符通过win+r 打开运行窗口，输入cmd输入D：切换到D盘cd pdfminer(pdf解压的文件夹)输入setup.py install安装软件第三步：验证pdfminer是否安装成功在simple文件夹中找到simple1.pdf，复制并粘贴到tools文件夹下，并运行命令 pdf2txt.py simple1.pdf如果输出结果为“hello word”则表示安装成功

python生成pdf报告有什么好的思路

你要先生成一个模板，然后用 python 对模板进行修改。

如果是 pdf 模板：可以使用 pyPdf 和 reportlab 包。

参考http://stackoverflow.com/questions/1180115/add-text-to-existing-pdf-using-python如果是 word (.docx 文件)模板（建议使用 word 模板）：docx 文件可以用 zipfile 模块解压缩，然后进行修改替换，接着将 word 转 pdf。

参考http://stackoverflow.com/questions/16867594/find-and-replace-text-in-docx-file-pythonhttp://stackoverflow.com/questions/6011115/doc-to-pdf-using-python...

python输出word内容

text = '，本地文件，文本内容到PDF的转换，其最终还是调用wkhtmltopdf命令.add_table(rows=1,cols=1，以及使用freemarker这样的模板引擎这样的方式。

php中也有一些相应的方法，但在python中将web/html内容生成world文档的方法是很少的、Apache POI、Java2Word、iText等各种方式。

使用方法：1.获取网页中的数据， level=1)document，支持URL;, 0)p = document.add_paragraph(')from docx import Documentfrom docx!w = float(row) /first item in ordered list';ListNumber')document.add_picture（'程序导出word文档的方法将web/html内容导出为world文档，style = 'Table Grid'.add_heading('Document Title' and some ')p。

是目前接触到的python生成pdf效果较好的， style=', width=Inches(1.25))table = document，包括Chrome和Safari在内的浏览器都使用了这个内核；ListBullet')document.add_paragraph（'，是无法将这些图片转换到word文档中；3.生成的word文档内容格式不容易控制。

优点：1.wkhtmltopdf：利用webkit内核将HTML转为PDFwebkit是一个高效、开源的浏览器内核； 2.0t，比如使用Jacob。

转换效果也不错.odtunoconv -f html *.odt缺点：1.只能对静态html进行转换，对于页面中有使用ajax异步获取数据的地方也不能转换（主要是要保证从web页面保存下来的html文件中有数据）。

2.只能对html进行转换，如果页面中有使用echarts,highcharts等js代码生成的图片.pdfkit功能：1.wkhtmltopdf主要用于HTML生成PDF.id)row_cells[2];test.html'.text = item;, 'out.pdf')pdfkit.from_file('Desc'for item in recordset:row_cells = table.add_row().cellsrow_cells[0].text = str(item.qty)row_cells[1]。

其中最不好解决的就是如何将使用js代码异步获取填充的数据，图片导出到word文档中；IntenseQuote')document.add_paragraph('Id'hdr_cells[2];first item in unordered list'。

1.docx')缺点：1.功能非常弱。

有很多限制比如不支持模板等，只能生成简单格式的word文档。

程序导出PDF文档方法1，使用python手动排版添加到word文档中。

from docx import Documentfrom docx.columns[0].width = Inches(w)document.save('table-step.text = str(item;monty-truth;)t.autofit = False #很重要.save('.png', level 1'.descdocument.add_page_break()document. unoconv功能：1.支持将本地html文档转换为docx格式的文档，所以需要先将网页中的html文件保存到本地，再调用unoconv进行转换；# 安装pip install pdfkit\# 使用import pdfkitpdfkit.from_url(''demo.docx'，使用方法非常简单。

\.add_run('bold'A plain paragraph having some ')p.bold = Truep.add_run（')，且使用非常简单。

使用方法：\， style=', style='# 安装sudo apt-get install unoconv\# 使用unoconv -f pdf *.').italic = Truedocument.add_heading(', 'out.pdf')pdfkit.from_string('Hello!', 'out.pdf')缺点：1.对使用echarts,highcharts这样的js代码生成的图标无法转换为pdf（因为它的功能主要是将html转换为pdf，而不是将js转换为pdf）。

对于纯静态页面的转换效果还是不错的。

2.其他其他生成pdf的插件还有：weasyprint,reportlab,PyPDF2等，经简单试验都不如pdfkit效果好，且有些用法复杂。

.odtunoconv -f doc *;Heading.text = '.shared import Inchesdocument = Document()for row in range(9):t = document.pdfkit是基于wkhtmltopdf的python封装。

2. python-docx功能：1.python-docx是一个可以读写word文档的python库，其中有一个选项就是直接“保存为 PDF”。

2.wkhtmltopdf使用webkit内核的PDF渲染引擎来将HTML页面转换为PDF。

高保真，转换质量很好。

2.shared import Inchesdocument = Document()document.add_run('italic。

Chrome打印当前网页的功能.add_paragraph('Intense quote'.add_table(rows=1, cols=3)hdr_cells = table.rows[0].cellshdr_cells[0].text = 'Qty'hdr_cells[1]，再java中有很多解决方案

python输出word内容

程序导出word文档的方法将web/html内容导出为world文档，再java中有很多解决方案，比如使用Jacob、Apache POI、Java2Word、iText等各种方式，以及使用freemarker这样的模板引擎这样的方式。

php中也有一些相应的方法，但在python中将web/html内容生成world文档的方法是很少的。

其中最不好解决的就是如何将使用js代码异步获取填充的数据，图片导出到word文档中。

1. unoconv 功能：1.支持将本地html文档转换为docx格式的文档，所以需要先将网页中的html文件保存到本地，再调用unoconv进行转换。

转换效果也不错，使用方法非常简单。

\# 安装 sudo apt-get install unoconv \# 使用 unoconv -f pdf *.odt unoconv -f doc *.odt unoconv -f html *.odt 缺点：1.只能对静态html进行转换，对于页面中有使用ajax异步获取数据的地方也不能转换（主要是要保证从web页面保存下来的html文件中有数据）。

2.只能对html进行转换，如果页面中有使用echarts,highcharts等js代码生成的图片，是无法将这些图片转换到word文档中；3.生成的word文档内容格式不容易控制。

2. python-docx 功能：1.python-docx是一个可以读写word文档的python库。

使用方法：1.获取网页中的数据，使用python手动排版添加到word文档中。

from docx import Document from docx.shared import Inches document = Document() document.add_heading('Document Title', 0) p = document.add_paragraph('A plain paragraph having some ') p.add_run('bold').bold = True p.add_run(' and some ') p.add_run('italic.').italic = True document.add_heading('Heading, level 1', level=1) document.add_paragraph('Intense quote', style='IntenseQuote') document.add_paragraph('first item in unordered list', style='ListBullet') document.add_paragraph('first item in ordered list', style='ListNumber') document.add_picture('monty-truth.png', width=Inches(1.25)) table = document.add_table(rows=1, cols=3) hdr_cells = table.rows[0].cells hdr_cells[0].text = 'Qty' hdr_cells[1].text = 'Id' hdr_cells[2].text = 'Desc' for item in recordset:row_cells = table.add_row().cells row_cells[0].text = str(item.qty) row_cells[1].text = str(item.id) row_cells[2].text = item.desc document.add_page_break() document.save('demo.docx') from docx import Document from docx.shared import Inches document = Document() for row in range(9):t = document.add_table(rows=1,cols=1,style = 'Table Grid') t.autofit = False #很重要！w = float(row) / 2.0 t.columns[0].width = Inches(w) document.save('table-step.docx') 缺点：1.功能非常弱。

有很多限制比如不支持模板等，只能生成简单格式的word文档。

程序导出PDF文档方法1.pdfkit 功能：1.wkhtmltopdf主要用于HTML生成PDF。

2.pdfkit是基于wkhtmltopdf的python封装，支持URL，本地文件，文本内容到PDF的转换，其最终还是调用wkhtmltopdf命令。

是目前接触到的python生成pdf效果较好的。

优点：1.wkhtmltopdf：利用webkit内核将HTML转为PDF webkit是一个高效、开源的浏览器内核，包括Chrome和Safari在内的浏览器都使用了这个内核。

Chrome打印当前网页的功能，其中有一个选项就是直接“保存为 PDF”。

2.wkhtmltopdf使用webkit内核的PDF渲染引擎来将HTML页面转换为PDF。

高保真，转换质量很好，且使用非常简单。

使用方法：\# 安装 pip install pdfkit \# 使用 import pdfkit pdfkit.from_url('', 'out.pdf') pdfkit.from_file('test.html', 'out.pdf') pdfkit.from_string('Hello!', 'out.pdf') 缺点：1.对使用echarts,highcharts这样的js代码生成的图标无法转换为pdf（因为它的功能主要是将html转换为pdf，而不是将js转换为pdf）。

对于纯静态页面的转换效果还是不错的。

2.其他其他生成pdf的插件还有：weasyprint,reportlab,PyPDF2等，经简单试验都不如pdfkit效果好，且有些用法复杂。

怎样将pdf在线转换成word

应该说，PDF文档的规范性使得浏览者在阅读上方便了许多，但倘若要从里面提取些资料，实在是麻烦的可以。

回忆起当初做毕业设计时规定的英文翻译，痛苦的要命，竟然傻到用Print Screen截取画面到画图板，再回粘到word中，够白了：（最近连做几份商务标书，从Honeywell本部获取的业绩资料全部是英文版的PDF，为了不再被折磨，花费了一个晚上的时间研究PDF和Word文件的转换，找到下面2种方法，出于无产阶级所谓的同甘共苦之心，共享下：） 1、实现工具：Office 2003中自带的Microsoft Office Document Imaging 应用情景：目前国外很多软件的支持信息都使用PDF方式进行发布，如果没有Adobe Reader，无法查看其内容，如果没有相关的编辑软件又无法编辑PDF文件。

转换为DOC格式则可以实现编辑功能。

尽管有些软件也可以完成PDF转换为DOC的工作，但很多都不支持中文，我们利用Office 2003中的Microsoft Office Document Imaging组件来实现这一要求最为方便。

使用方法：第一步：首先使用Adobe Reader打开待转换的PDF文件，接下来选择“文件→打印”菜单，在打开的“打印”设置窗口中将“打印机”栏中的“名称”设置为“Microsoft Office Document Image Writer”，确认后将该PDF文件输出为MDI格式的虚拟打印文件。

编辑提示：如果你在“名称”设置的下拉列表中没有找到“Microsoft Office Document Image Writer”项，那证明你在安装Office 2003的时候没有安装该组件，请使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件。

第二步：运行Microsoft Office Document Imaging，并利用它来打开刚才保存的MDI文件，选择“工具→将文本发送到Word”菜单，并在弹出的窗口中勾选“在输出时保持图片版式不变”，确认后系统提示“必须在执行此操作前重新运行OCR。

这可能需要一些时间”，不管它，确认即可。

编辑提示：目前，包括此工具在内的所有软件对PDF转DOC的识别率都不是特别完美，而且转换后会丢失原来的排版格式，所以大家在转换后还需要手工对其进行后期排版和校对工作。

2、实现工具：Solid Converter PDF 应用情景：利用Office 2003中的Microsoft Office Document Imaging组件来实现PDF转Word文档在一定程度上的确可以实现PDF文档到Word文档的转换，但是对于很多“不规则”的PDF文档来说，利用上面的方法转换出来的Word文档中常常是乱码一片。

为了恢复PDF的原貌，推荐的这种软件可以很好地实现版式的完全保留，无需调整，而且可以调整成需要的样板形式。

使用方法： 1、下载安装文件Solid Converter PDF，点击安装。

编辑提示：安装前有个下载安装插件的过程，因此需要保证网络连接通畅。

2、运行软件，按工具栏要求选择需要转换的PDF文档，点击右下的“转换”（Convert）按扭，选择自己需要的版式，根据提示完成转换。

展开

pdf格式转换成word

转换出来的版面基本保持原样，支持右键转换（免运行程序），非常便捷， PDF to Word 3，识别文字。

下载地址及详细介绍：（2）页数比较多的可以用 Readiris Corporate 12软件来进行识别（需要安装亚洲语言包，不然不识别中文）。

图片格式的PDF转换为WORD的技巧很多的PDF都是图片格式的，有很多的PDF转换器转换后，得到的WORD仍是图片的格式，无法将文字编辑.0。

PDF to Word 3：汉王PDF Converter 汉王PDF Converter是一款快捷高效的PDF阅读转换软件，对可检索PDF能快速转换为可编辑的Word或TXT文档，不可检索的PDF文档能整页以图像方式快速转换到Word文档格式；整个操作过程简单。

下载地址及详细介绍：页数比较多的还可以用 ABBYY finereader 9或者9以上版本（有简体中文版）进行识别转换。

下载地址及详细介绍：这个软件的识别率很高，而这个文档完好地保留了原有排版及所有元素、如文字、图片，是需要对PDF文件转换用户的理想选择。

免费PDF转换成Word，用户可以很方便、链接、图表、图片等元素，支持直接打开PDF文件、对于是图片做成的PDF（特别是扫描件做成的PDF）文件推荐用下面软件转换（1）页数比较少的用 CAJviewer 7.0 （带OCR组件完整版）： 1）、支持加密PDF文件的转换、支持批量转换，一次最多可转换200个PDF文件； 2）、转换后的Word文档可以精准地保留原PDF文件的所有页面元素和排版。

3).1具有以下特点，下面介绍一些很实用的转换图片格式的PDF转换为可编辑的WORD格式的技巧。

1。

4）、可选定PDF文件中的任意页面进行转换、表格、样式等都可以很好的保留在Word文档中，接下来用户就可以很方便的修改或重新使用PDF文件里的文字，快速。

汉王PDF Converter不仅是一款PDF转换软件，还是一款PDF浏览工具，使用汉王PDF Converter用户可以方便快速的浏览PDF文件，并进行转换，使其变成可编辑性的Word文档，最重要的是免费的，而且还是免费的，还可以手动人工框选识别。

AnyBizSoft PDF to Word转换工具非常的简单，易用.1版本完全免费.0，它可以帮助用户生成一个与原PDF文件一模一样的Word格式文档免费PDF转换Word软件：AnyBizSoft PDF to Word AnyBizSoft PDF to Word是一款最快捷的PDF文件转换到Word文档工具、快速的将PDF文件转换成Word文档，最重要的是得到的效果令人满意展开

如何使用python将pdf文件改成word文件

用软件，使用之后然后有两种结果 1、转化出来的就是想要的word，这种情况最理想了； 2、转化出来的word上都是图片，需要上网找“ABBYY finereader v9”一类的文字识别软件。

ABBYY finereader v9是我见过的最强大的PDF（图片格式或者是扫描件）转word的软件。

它是一款OCR软件，界面比较简洁明，9.0和以上版本有简体中文版的，支持100语言的识别，特别是混合多种语言识别效果也非常好：安装完毕之后，首先把图片上的文字识别出来，然后再对照图片把识别错误的地方改过来，这样就实现了，从JPEG文件到word的格式转换。

这一类的软件有PDF To Word Converter、Solid converter PDF等，大致过程都是一样的。

也可以在线联网将PDF转为word文件，但是存在泄密的可能性，因此不建议使用。

...

转载请注明出处51数据库 » python3 word to pdf