当前位置:主页 > 科技论文 > 自动化论文 >

OCR技术研究进展及前瞻

发布时间:2014-07-30 10:35

  1、概述

  OCR (Optical Character Recognition),即光学字符识别,是指 电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程即对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。

  随着计算机网络飞速发展信息电子化已经成为个时代必然趋势。文字作为信息中最重要、最集中的载体,其电子化进程显得尤为重要。而OCR技术则是文字电子化过程中最重要的环节,它改变了传统的纸质介质资料输入的概念。比如,通过OCR技术.用户可以将通过摄像机、扫描仪等光学输入方式得到的报刊‘书籍、文稿、表格等印刷品的图像信息转化为可以供计算机识别和处理的文本信息。因此与传统的手工录入方式相比OCR技术大大提高了人们进行资料存储.检索.加工的效率。目前市场上符合银行、证券、保险.税务、公安.海关、机场、工商、军队及其它行业应用的OCR产品已经相对成熟,它们已经通过市场检验并被广大用户大规模使用11-4J。

  2、OCR技术的起源及发展

  OCR的起源最早追溯到1929年德国的科学家Taushcck获得了 光学字符识别技术专利间,但是对于当时的科技发展情况而言,一切仅仅是个设想『直到计算机的诞生才使得这种设想成为现实。经过近百年的发展OCR已经成为当今模式识别领域中最活跃的分支之一。它综合了数字图像处理、计算机图形学及人工智能等多方面的理论知识并在计算机及其相关领域中得到了相当广泛的应用。近几年来,它同语音识别、行为识到等一起曰益成为人们研究及关注的焦点。

  在二十世纪六七十年代,世界各国就已经展开了光学字符识别研究,如我们的邻国日本,在六十年代中期就有了邮政编码识别系统的产品问世,该系统能够识别邮件上的邮政编码,帮助邮局进行区域分信作业,这也使得邮政编码一直沿用至今,6,随后,经过科研学者的努力,日本的三洋,笔耕论文,富士,理光,松下等知名公司也相继有字符识§lIJ系统的产品面世。

  我国的光学字符识别研究相对国外起步较晚!但是发展十分迅速。从早期简单的单体识别发展到多种字体混合排列的多体识别,从中文印刷材料的识别发展到中英文混排印刷材料的双语言识别,目前各个系统都可以支持筒、繁体汉字的识别,也有同时支持中,英,韩等多国文字的识别系统,它们解决了多体多字号混排文本的识别问题,对于简单的版面可以进行效的定量分析,同时汉字识别率已经可以达到98%以上。

  推荐阅读:《计算机研究与发展》

  3、OCR技术的应用

  国外的OCR技术应用相对成熟,包括IBM、Motor口怡、HP和Microsoft等世界型大公司都陆续展开了这方面的研究,在他们的产 品中绑定OCR技术。光符识别设备把报纸、杂志和其它印刷材料上的印刷字符读取到计算机内存。OCR软件可以和任何流行的操作系统一起使用。除了识别印刷字符之外OCR也可能识别栏目布局,这种布局会在报纸中出现。例如,微软公司最新推出的办公套件一一州icrosoft Office XP中不仅加强了原有对手写输入的支持,还新增加了光学字符识别(OCR)的工具组件。字符识别产品的广泛应用推动了模式识别等相关理论的发展,促进了计算机应用的普及。2008竿, Google也宣布它将开始在网络蜘蛛中使用OCR技术,这样就可以识别许多非格式化文本和图像并将其索引到数据库。

  如今OCR技术在我国的应用也极为广泛,可以说有汉字的地方就有OCR技术应用的存在。在信息技术及计算机技术日益普及的今天,如何将文字方便、快捷地输入到计算机中已经成为影响人机接口效率的一个重要难题,也关系到计算机是否能够真正在我国得到普及和应用。

  汉字输入主要分为人工键盘输入和机器自动识别输入两种c其中人工键入速度慢而且劳动强度大,自动输入又分为汉字识别输入及语音识别输入。从识另IJ技术的难度来说,手写体识别的难度高于印刷体识别,而在手写体识别中,脱机手写体的难度又远远超过联机手写体识别。歪IJ目前为止,除了脱机手写体数字的识别已有实际应用外,汉字等文字的脱机手写体识别还处在实验室阶段。简单来说,从影像到结果输出,须经过影像输入、影像前处理、文字特征抽取、~t对识别、最后经人工校正将认错的文字更正,将结果输出等环节的过程。

  随着我国信息化建设全面普及OCR技术的应用前景将更加地广阔。就目前从行业需求来看,金融、保险、税务、工商‘电子商务等行业对信息识别的需求已经越来越广泛,促进了识别技术的大规模应用。而个人消费者对资料电子化、手写识别技术等各方面需求则拓展了OCR识另IJ技术在这一领域的应用之路,另一方面,网络时代的高速发展使个人资料电子化、商务办公自动化等需求的呼声也变得越来越高。

 



本文编号:6149

资料下载
论文发表

本文链接:https://www.wllwen.com/qitalunwen/6149.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户04a72***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]