我有部分的不完善的办法,OCR只能一次 哦!没听说过二次 OCR 的,就像 “数据无损压缩”怎么可能二次、再次 呢?!
—— 但比较专业点儿呀,只怕你不太能懂。
(还有,你提问分类错了哦,放在编程开发或软件儿类比较合适,至少也得放在计算机应用或OS相关的选项里。)
我就是专做电子书(数据加工主类)的,可以交流、切磋、探讨。
单纯的识校 OCR 是远不够的,业内周知,OCR 按模式识别的数据对象,大致分为三大类,印刷体(如屏幕识别:汉字显码)、扫描体、手写楷体(或很简单清晰的行楷、隶书等),当然还根据处理时期,分为实时(联机)和非实时(脱机)两种,后者一般都要远远复杂于同类型对象的前者。因为基础算法的瓶颈儿之故(桎梏),模式识别和计算语言学的学科建设虽初见成效,但仍、还任重道远。所以现在的识别率也基本只能停留在(指相对清晰的——至少肉眼可辨识 的 扫描版)98.0-99.5%的范围内吧,也就是“误码—乱码率”在0.5-2.0%之间(其实对海量数据而言,还是挺‘可观’的哦!)!—— 尽管不能再次识别(要是能不就直接集成到OCR工具里了吗,干嘛非要手工再次启动识别作业呢?),但完全可以通过前期预处理(对 扫描体源图),和识别后—校对前,的后期处理来实现。然后手工校对,就很简单了。
笔者 邮箱可留此:phithinior@yahoo.com.cn。
有什么推荐的文字校对软件
一般用黑马软件,但只能校对错别字。从事校对工作的人一般还是人工来看的,没有任何捷径啊!
有谁有可以识别英语的OCR软件
汉王OCR 5.0 增强版
汉王公司凭借其在文字识别方面多年的技术积累,推出的中文OCR软件文本王,无论在识别速度还是识别正确率上都明显领先于其主要的竞争对手,如清华紫光、文通、丹青、尚书等产品。对于随扫描仪捆绑赠送OEM版软件,更有着无法比拟的性能优势。强烈推荐所有有扫描仪的朋友下载!
汉王文本王是针对机关单位、企业及有文字录入需求的个人用户,在日常的工作中,快速的对书刊、报纸、公文、宣传页等印刷稿件中内容进行录入的应用需求而推出的。
本产品集成了汉王科技顶尖的文字识别技术,对印刷文稿录入的识别率高达99.5%,能够识别百余种印刷字体和各种中英繁表图混排格式的文本,并具备朗读校对、翻译功能。是理想的文字、表格、图像录入系统。
■ 硬件要求
CPU:Pentium MMX以上
内存:64M以上
硬盘空间:210M以上
USB接口
■ 软件环境
简体中文、英文Windows98/ME/2000/XP,英文Windows必须有中文平台支持。
■ 主要功能
批量输入 高速准确
超强、高速批量处理功能,可连续扫描并识别1000页稿件。
全自动识别宋、仿宋、楷、黑、圆、魏碑、隶书、行楷等百余种中文简繁,英文、数字、表格、图片混排的稿件,准确率高达99.5%。
工程文件方便管理,工作进度随时保存,打开工程即可继续工作
一键扫入 WORD输出
操作简单快捷,只需按下扫描按钮,即可把识别结果直接输出到Microsoft Word文档中;
工作方式任君选择,既可选择自动方式一键录入到Word;也可选择单步方式,逐步完成扫描、版面分析、识别、校对,最后发送至Word。
文 表 图 轻松输入
获取图像支持黑白二值、256级灰度和24位真彩色的图像类型,支持bmp、tif、jpg的图像格式。
准确判识表格、图像、文字,将录入内容迅速转化成为电子化表格,实现用户随意编辑。
复杂版面 精确还原
超强智能分析各种中、英、繁、表、图混排格式的文本,无需过多人工干预。
精确版面还原,原汁原味。
图文对照 超强校对
校对时,录入稿与原文同时对应出现,形成清晰对照,实现快速准确的超强校对。
识别结果可以保存为(PDF、HTML、RTF、XLS、TXT)多种格式的文件,方便实用。
图片管理 全文索引
识别结果可以导出为ACDSee图文索引,轻松实现图片文档的全文检索、管理。
朗读校对 英汉互译
可使用汉王阅读小精灵进行文稿校对,轻松、高效。
翻译软件辅助翻译,助您跨越语言障碍,省时省力,极大地提高了工作效率。
摘抄高手 随意发送
对扫描图像文字内容随意识别摘抄,即时编辑,并可发送到任意文字输入窗口。
文件压缩包大小30M 需要的话可以给我发消息并留下你的E-mail。
OCR有哪些功能
汉字识别OCR("光学字符识别"的英文编写)是为了使汉字信息高速输入计算机,以解决低速的信息输入与高速信息处理之间的矛盾,从而提高整个计算机系统的效率。这种根据汉字人工编码录入汉字文本的方法,从根本上改变了人们对计算机汉字人工编码录入的概念。使人们从繁重的键盘录入汉字的劳动中解脱出来。只要用扫描仪将整页文本图像输入到计算机,就能通过OCR软件自动产生汉字文本文件,这与人手工键入的汉字效果是一样的,但速度比手工快几十倍。所以OCR产品的推广意义是深远的。
提高OCR识别率
购买了扫描仪,你一定会发现,附赠的软件中有中英文OCR识别软件,当然一般都是基础版。很多人认为此类OCR的识别率不是很高,甚至怀疑只有那些正版的数千元的OCR软件其识别率才很高。其实,你只要注意使用技巧,此类OCR的识别率完全可达实用化水平。
1、处理原稿扫描图像,使之清晰可“辨”。在其它因素都满足的前提下,对一般的印刷稿、打印稿(包括清晰的针打稿)等质量较好的文稿进行识别,其识别率一般可达到98%以上。而对报纸、复印件等不太清晰的文稿进行识别,无论哪种OCR都难以达到较高的识别率。对那些原稿不太清晰的,要注意识别前对图像加以处理,除去其上的污迹。并注意将偏斜的版面“改斜归正”,通常OCR软件均有此功能,且一般都设有自动纠偏和手动纠偏。
2、分辨率应选择适宜。一般选择300dpi较合适,分辨率选小了会使识别率降低,选得太大了并不能有效提高识别率,还会大幅度加长文件长度,浪费处理时间。有的扫描软件设备上有一项“OCR扫描”,干脆将分辨率锁定为300dpi,这是很有道理的。
3、调整好亮度值和对比度值。这条非常关键,对识别率的影响很大。亮度值的调整是在识别前,先看看扫描得到的图像中文字质量如何,如果文字线条凹凸不平,甚至有断线,说明亮度值太大了,应减小亮度值;当文字线条很黑很粗,甚至挤成了黑疙瘩,分不清笔划时,则说明亮度值太小了,应增加亮度值;对比度的调节要视原稿确定,笔者常根据预扫时图像清晰度确定。
4、利用OCR的自学习功能。有时OCR对某些字总是难以识别,比如OCR开始对“的”和“二”等字总是搞错,这时可以利用OCR软件的自学习功能,“引导”它正确识别一次(有些不同的字体各需一次),它以后就对这些字“熟识”了。具体操作极易,上机看一下菜单即可明白。另外,若原稿全是英文或其中中文很少,最好用附赠的英文OCR软件。还有,现在已有一些很好的文字校对软件,其中一般都设置了OCR校对,利用这些软件先行处理一下所得文本文件,则可大大减轻人工校对负担。
OCR文字识别的OCR软件结构
ocr文字识别软件的结构,无非就包括一下的这几点:
1、ocr文字识别软件的功能栏中的功能:极速识别、票证识别、图片局部识别、语音识别等等;
2、可以选择识别效果和识别类型;
3、可以修改文件的输出目录;
想起来了,有一个叫迅捷的ocr文字识别软件,可以满足上面的几点,楼主您去看看,就知道啦!
影响OCR的识别的因素有哪些?
提高OCR识别率
购买了扫描仪,你一定会发现,附赠的软件中有中英文OCR识别软件,当然一般都是基础版。很多人认为此类OCR的识别率不是很高,甚至怀疑只有那些正版的数千元的OCR软件其识别率才很高。其实,你只要注意使用技巧,此类OCR的识别率完全可达实用化水平。
1、处理原稿扫描图像,使之清晰可“辨”。在其它因素都满足的前提下,对一般的印刷稿、打印稿(包括清晰的针打稿)等质量较好的文稿进行识别,其识别率一般可达到98%以上。而对报纸、复印件等不太清晰的文稿进行识别,无论哪种OCR都难以达到较高的识别率。对那些原稿不太清晰的,要注意识别前对图像加以处理,除去其上的污迹。并注意将偏斜的版面“改斜归正”,通常OCR软件均有此功能,且一般都设有自动纠偏和手动纠偏。
2、分辨率应选择适宜。一般选择300dpi较合适,分辨率选小了会使识别率降低,选得太大了并不能有效提高识别率,还会大幅度加长文件长度,浪费处理时间。有的扫描软件设备上有一项“OCR扫描”,干脆将分辨率锁定为300dpi,这是很有道理的。
3、调整好亮度值和对比度值。这条非常关键,对识别率的影响很大。亮度值的调整是在识别前,先看看扫描得到的图像中文字质量如何,如果文字线条凹凸不平,甚至有断线,说明亮度值太大了,应减小亮度值;当文字线条很黑很粗,甚至挤成了黑疙瘩,分不清笔划时,则说明亮度值太小了,应增加亮度值;对比度的调节要视原稿确定,笔者常根据预扫时图像清晰度确定。
4、利用OCR的自学习功能。有时OCR对某些字总是难以识别,比如OCR开始对“的”和“二”等字总是搞错,这时可以利用OCR软件的自学习功能,“引导”它正确识别一次(有些不同的字体各需一次),它以后就对这些字“熟识”了。具体操作极易,上机看一下菜单即可明白。另外,若原稿全是英文或其中中文很少,最好用附赠的英文OCR软件。还有,现在已有一些很好的文字校对软件,其中一般都设置了OCR校对,利用这些软件先行处理一下所得文本文件,则可大大减轻人工校对负担。
参考资料:http://www.cybersky.com.cn/skill/ocr.htm
转载请注明出处51数据库 » 有校对功能ocr软件 可以进行二次ocr的软件谢谢