如何将PDF格式的表格转化成word或者Excel格式
展开全部各种格式文件ocr成word文件的方法你还在为不同格式的文件怎么变成word文件发愁吗?各种识别软件各有缺陷,识别效率低,让你痛苦不堪,有的只能识别字,对表格和图形无能为力,识别完了,版面乱七八糟,无法使用。
现在好了,本文针对各种情况下文字识别进行总结,帮助大家掌握正确方法,节省时间,本文给出了所有情况下全文件表格、图形、文字识别的完美解决方案: 1、PDF文件的识别: 1)文件可以直接识别的(以文本形式保存的PDF文件):安装acrobat 7专业版,注意不是acrobat reader(下载 http://www.xdowns.com/soft/4/136/2006/Soft_29430.html),直接另存为rtf文件(识别整个文件),或者选择工具栏上的文字选择按钮,然后选择文字区域,然后复制到word等中。
2)文件不能直接识别的(以图片形式保存的PDF文件):安装office2003(下载http://www.xdowns.com/soft/188/215/2006/Soft_28356.html ),并装上office工具Microsoft Office Document Imaging(完全安装此工具),然后在打印机里面会增加Microsoft Office Document Image Writer打印机,然后将PDF文件打印到此打印机,选择打印形成的文件的保存位置,然后会自动形成一个MDI文件,并且自动用Microsoft Office Document Image打开此文件,然后选择“工具”菜单下的“使用ocr识别文本”,识别完成后,在选择“工具”下的,“将文本发送到word”,最后将把整个PDF文件识别输出到word文件中。
注意:Microsoft Office Document Image可以非常准确的全文件识别转化中文、英文、表格,但是无法将图形输出到word,而是把文件中的所有图形单独形成一个个独立的图片文件,放在相同位置的一个相同名称的文件夹中,因此可用snagit软件将图形打开,然后复制到word中。
(所有的识别软件都不能很好的处理图形的识别问题,Microsoft Office Document Image的这种处理方法已经是非常好的解决这个问题了。
) 3)加密的Pdf文件:先下载解密软件(下载http://www.xdowns.com/soft/4/85/2006/Soft_29750.html ),解密后在参看1),2) 4)繁体pdf文件:用2)的方法识别到word后,用word中的“工具”--“语言”---“中文繁简转换” 2、caj文件的识别: 1)局部文字识别:直接使用caj浏览器(下载地址 http://www.xdowns.com/soft/4/136/2006/Soft_29737.html )的ocr 2)全文件识别:打印到Microsoft Office Document Image Writer打印机,后面和上面的2)操作一样 3)博硕论文全文下载:在线阅读博硕论文,待可以看到最后一页后,不要关闭caj浏览器,到caj安装目录下cache中找到一个较大的文件,拷贝到其他位置即可。
然后使用2)全部转化为word。
3、超星文件的识别: 1)局部文字识别:直接使用超星浏览器(下载地址 http://www.xdowns.com/soft/31/91/2006/Soft_27810.html )的ocr 2)全文件识别:打印到Microsoft Office Document Image Writer打印机,后面和上面的2)操作一样,要注意的是,超星打印功能有点区别,因为超星是目录和全文分开的,所以打印时,需要分别把目录和正文识别到word中,在合并到一起。
打印时要填入打印页码从1到最后一页,不要选择打印全部。
此外在打印选项中,还要将页面比例设成真实大小,而不是整宽。
注意:识别速度比其他格式要慢很多,请保持耐心,但是最后当你看到轻松的生成全本书的word版本时,你会欣喜若狂的,呵呵。
我的试验结果是一本280页的书,识别需要几分钟的时间。
3)超星相对比较麻烦一些,如果还有问题,可以先把超星打印成完整的pdf文件,然后在用1、的方法转成word 4、其他情况下的识别: 使用snagit软件(下载 http://www.xdowns.com/soft/31/46/2006/Soft_29690.html )将任何形式的文字可以变成图片,例如使用snagit将屏幕拷贝成图片,然后右键点击图片文件,用microsoft Office Document Image打开图形,其他和2)一样。
注意:其他的各种识别软件请不要在用,因为要么只能识别中文,要么只能识别英文,要么不能识别整个文件,要么不能识别屏幕拷贝图像,要么识别误差很大,要么不能识别表格,要么需要注册,要么识别速度很慢,要么使用不便(和word结合不紧),这些软件包括:紫光ocr,万方pdfocr,尚书,汉王,ScanSoft PDF Converter,pdf2word,以及各种被推荐的软件等等,我都装过,现在都像LJ一样删除了。
只要安装了acrobat 专业版,snagit,office2003,现在你可以完美的做任何事,最重要的是这几个软件很好得到。
针对一些问题的补充: 经过一些试验,发现microsoft Office Document Image 存在一些不稳定的问题,例如在用caj打印到Microsoft Office Document Image Writer打印机时,发现用caj5.5版本比较快,(caj5.5不能加升级补丁),而caj5.0有时出现假死机。
另外页面显示大时,转化的识别率较高。
如果页数多的文件,包括超星,如果有问题,可以分多次转化。
再次补充: 1、由于虚拟打印到Microsoft Office Document Image Writer 比较慢,并且形成的虚拟文件很大,1本200多页的书大约是60M,因此会严重影响机器的运行速度和C盘空间以及内存空间,建议配置...
PDF格式里面的表格怎么转换成word?
1. 首先使用Adobe Reader打开待转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”设置窗口中将“打印机”栏中的“名称”设置为“Microsoft Office Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。
2. PDF2Word 1.6 绿色汉化版 软件类别:汉化补丁 / 免费软件 / 电子阅读 软件语言:简体中文 PDF2Word能够从PDF格式文档中提取文字、图形和其它内容存放入Word格式文档中,因此你就能重复利用你的PDF文档内容,在Word中再编辑文字、排版及重整布局;并且它是一个独立软件,不需要安装Microsoft Word、Adobe Acrobat软件支持。
3. 附件中有PDF文档,就可以直接点击该按钮将它转换成Word文件。
有时我们在网上搜索到PDF格式的文件,同样可以通过右键菜单的相关命令直接在Word中打开它。
4. 首先使用Adobe Reader打开待转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”设置窗口中将“打印机”栏中的“名称”设置为“Microsoft Office Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。
5. PDF2Word 1.6 绿色汉化版 软件类别:汉化补丁 / 免费软件 / 电子阅读 软件语言:简体中文 PDF2Word能够从PDF格式文档中提取文字、图形和其它内容存放入Word格式文档中,因此你就能重复利用你的PDF文档内容,在Word中再编辑文字、排版及重整布局;并且它是一个独立软件,不需要安装Microsoft Word、Adobe Acrobat软件支持。
6. 附件中有PDF文档,就可以直接点击该按钮将它转换成Word文件。
有时我们在网上搜索到PDF格式的文件,同样可以通过右键菜单的相关命令直接在Word中打开它。
如何将pdf格式的档案转化成word或电子表格?
1. 可检索内容的PDF(内容可以用鼠标选中的非双层PDF)文件,推荐用下面软件转换:PDF To Word Converter, 是一款将AdobePDF文档转换成 Word 文档的工具软件,它支持文字,图像及其它内容的输出。
这款软件可以脱离 Microsoft Word,Adobe Acrobat 或 Acrobat Reader 独立运行。
无需注册,绿色软件。
2. 对于用图片做成的PDF(特别是扫描件做成的PDF)文件,推荐用汉王PDF OCR 8.0软件转换,或Adobe Acrobat X Pro(要注册)。
3. 对于一些不允许做修改的PDF文件(就是加密加了权限的PDF),那么就先要去除密码或者去除数字证书,才能照上面两个步骤做(推荐用PDF Password Remover去除密码)。
需要的话留下EMAIL,发给你。
也可以自己搜索下载。
怎么把pdf文件转换成word
展开全部 转换前,首先要保证pdf文件是可编辑的(即可以选择、复制,且没有乱码)。
如果有乱码,说明文件可能被加密了,那就需要先解密安装并打开Solid Converter PDF V7软件进入"工具",在左侧选择“word(I)”,然后在右侧根据需要进行一些设置(只需在首次使用时进行,也可不进行设置)将需要转换的pdf文件拖拽到软件中,选择导出word,对弹出的页面进行快速设置(一般默认即可,然后点击确定)软件开始转换,转换完成后会自动打开word。
转换后的word文件默认存放在原来的pdf文件夹下,调整一下格式就可以使用了...
pdf如何转换成word
二、把PDF转换成Word的方法Adobe Acrobat 7.0 Professional 是编辑PDF的软件。
用Adobe Acrobat 7.0 Professional 打开他另存为WORD试试看。
或者用ScanSoft PDF Converte,安装完成后不须任何设置,它会自动整合到Word中。
当我们在Word中点击“打开”菜单时,在“打开”对话框的“文件类型”下拉菜单中可以看到“PDF”选项,这就意味着我们可以用Word直接打开PDF文档了!ScanSoft PDF Converter的工作原理其实很简单,它先捕获PDF文档中的信息,分离文字、图片、表格和卷,再将它们统一成Word格式。
由于Word在打开 PDF文档时,会将PDF格式转换成DOC格式,因此打开速度会较一般的文件慢。
打开时会显示PDF Converter转换进度。
转换完毕后可以看到,文档中的文字格式、版面设计保持了原汁原味,没有发生任何变化,表格和图片也完整地保存下来了,可以轻松进行编辑。
除了能够在Word中直接打开PDF文档外,右击PDF文档,在弹出菜单中选择“Open PDF in Word”命令也可打开该文件。
另外,它还会在Outlook中加入一个工具按钮,如果收到的电子邮件附件中有PDF文档,就可以直接点击该按钮将它转换成Word文件。
有时我们在网上搜索到PDF格式的文件,同样可以通过右键菜单的相关命令直接在Word中打开它。
转载请注明出处51数据库 » 怎么把pdf表格转换成word