基于EmguCV的文档图像预处理研究

发布时间:2024-04-01 04:46
  日常生活中,为了文档保存和交流的方便,人们经常需要将纸质的文档数字化,对文档进行数字化的方式一般是通过扫描仪扫描或者相机拍照的方式,这种方式获取的带有文档信息的图片即文档图像。目前市面上常用的文档图像处理软件在对文档图像进行二值化处理时用的算法是基于全局阈值的方法,对于光照均匀的文档图像其处理效果正常,但是对于存在光照不均匀的文档图像时会出现大块的黑色区域或者白色区域。文档图像在获取时经常会由于采集设备、文档自身保存状况以及后期的二值化处理步骤而存在噪声,噪声会影响文档图像使用者的视觉感观。此外在获取文档图像时由于文档与采集设备之间的角度偏移会导致拍摄出来的文档图像具有倾斜形变,发生倾斜形变的文档图像会影响视觉观感以及OCR识别的准确率。近年来随着智能手机厂家在其手机拍摄后的照片上面添加了相机水印,手机拍摄到的文档图像也会具有相机水印,相机水印的存在会干扰后期的OCR识别准确率。针对这些问题,需要对文档图像进行二值化、滤波、倾斜校正以及相机水印去除等一系列预处理工作,主要工作如下:1)基于EmguCV(Emgu Computer Vision),利用C#开发了一款文档图像预处理软件,能...

【文章页数】:79 页

【学位级别】:硕士

【部分图文】:

图1-1相机水印

图1-1相机水印

图1-1相机水印图1-2文档倾斜1.2国内外研究现状针对文档图像的预处理,国内外的学者已经研究了很多年,取得了大量的研究成果,在国内,北方工业大学以曾凡锋副研究员和童立靖教授为首的研究团队在这方面做了大量的工作,成果丰硕。针对文档图像中存在的影响后续OCR识别准确....


图1-2文档倾斜

图1-2文档倾斜

图1-1相机水印图1-2文档倾斜1.2国内外研究现状针对文档图像的预处理,国内外的学者已经研究了很多年,取得了大量的研究成果,在国内,北方工业大学以曾凡锋副研究员和童立靖教授为首的研究团队在这方面做了大量的工作,成果丰硕。针对文档图像中存在的影响后续OCR识别准确....


图2-2中值滤波处理方法

图2-2中值滤波处理方法

第2章文档图像的二值化及滤波点灰度值相差比较大的像素点的灰度值,从而达成滤除噪声的目的。中值滤波在一定程度上保持了图像的边缘细节,因此可以得到清晰的图像,对边缘的保护效果要比均值滤波好一些。中值滤波的基本思想是取一个特定结构的二维滑动模板,按照灰度值的大小对模板内各像素点的....


图2-3图像去噪对比图

图2-3图像去噪对比图

(a)含有椒盐噪声的图像(b)中值滤波后的图像图2-3图像去噪对比图此处介绍的两种方法属于空间域滤波方法,下面再介绍一下频率域的滤波方法。2.3.3形态学滤波方法常见的形态学滤波方法只适应于二值化之后的图像,形态学操作依赖数学形态学中的四个基础的运算:膨胀(用符号“⊕”表....



本文编号:3944993

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3944993.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户934dd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]