一、文件格式转换
OFFICE 2003就可完成此项工作。
首先启动“Microsoft Office/ Microsoft Office 工具/Microsoft Office Document Scanning”。(提示:Office 2003默认安装中并没有这个组件,如果你第一次使用这个功能可能会要求你插入Office2003的光盘进行安装。
) 点击工具栏中的“使用OCR识别文字”按键,就开始对图片进行识别了。按下“将文本发送到Word”按键即可将识别出来的文字转换到Word中去了。
如果你要获取部分文字,只需要用鼠标框选所需文字,然后点击鼠标右键选择“将文本发送到Word”就将选中区域的文字发送到Word中了。 此外紫光OCR、汉王OCR、尚书六号等专业的OCR软件也可以,不过使用OCR识别前最好将图片格式用ACDSEE等工具软件改为黑白的TIFF格式。
不过受目前识别技术的限制,识别率都不能达到100%,尤其如果带附图很容易出错。 。
二、转换格式请问如何将只读文件转成WORD文档格式
运行Acrobat Reader,打开要提取文字的pdf文档,单击菜单“文件→打印”,在出现的“打印”窗口中,打印机名称一定要选择“Microsoft Office Document Imaging Writer”,“打印”成一个mdi文件,同时系统会自动启动“Microsoft Office Document Imaging”并显示出刚刚保存的mdi文件。
在Microsoft Office Document Imaging的窗口中,单击菜单“工具→将文本发送到Word”,在弹出的窗口中单击“确定”,系统会自动对整个页面进行OCR识别,识别完毕之后,会自动启动Word,并把识别出来的文字显示在Word文档中。
三、图片转成文档格式
这是最简单的办法,其它的要借助专门的OCR识别软件,如尚书六号等 用Word2003即可。
第一步 需要安装“Microsoft Office Document Imaging”的组件,点“开始→程序”,在 “Microsoft Office 工具” 里点“ Microsoft Office Document Imaging” 即可安装运行。 第二步 打开带有文字的图片或电子书籍等,找到你希望提取的页面,按下键盘上的打印屏幕键(PrintScreen)进行屏幕取图。
第三步 打开Microsoft Office Word 2003 ,将刚才的屏幕截图粘贴进去;点击“文件”菜单中的“打印”,在安装Microsoft Office Document Imaging组件后,系统会自动安装一个名为“Microsoft Office Document Imaging Writer”的打印机。 如图2所示,在“打印机”下拉列表框中选择“Microsoft Office Document Imaging Writer”打印机,其他选项无须额外设置,点击“确定”按钮后,设定好文件输出的路径及文件名(缺省使用源文件名),然后很快就可以自动生成一个MDI格式的文档了。
打开刚才保存的MDI类型文件,根据你的需要用鼠标选择文字内容(被选中的内容在红色的框内),然后单击鼠标右键,在弹出的快捷菜单中选择“将文本发送到Word”,即可将图片内容自动转换为一个新的Word文档,然后你就可以在Word文档中随心所欲地进行编辑了。 。
转载请注明出处51数据库 » 怎么把文件改成word格式化
有哥摔过