复杂背景下基于神经网络的驾驶证识别技术的研究与实现

发布时间:2024-03-15 02:32
  近年来,OCR(光学字符识别)技术已经发展的比较成熟,被广泛应用在生活中的方方面面,学校门禁处的驾驶证识别系统就是采用的这种技术。但学校的驾证识别系统对姓名文字识别的准确率不是很高,约为80%左右,为了进一步提高驾证姓名的识别率,本课题组将采用深度学习的方法重新设计驾驶证姓名识别系统,分别在预处理部分和文字识别部分对算法做一定的优化和改进。针对学校驾驶证识别系统识别率不高的问题,本课题主要从两个方面进行改善:一是在预处理阶段改进算法,采用红章定位的算法,使系统能更精确的定位和提取驾驶证姓名区域;二是在识别阶段采用改进算法的卷积神经网络LeNet-5训练模型。在预处理阶段,本课题会对图像进行一些必要的图像处理操作,比如非均匀光照射、高斯滤波、倾斜矫正、灰度化、二值化和添加噪音等。在定位提取姓名区域阶段采用红章定位的算法,即先定位红章的区域,再根据红章与姓名区域的位置比例关系定位驾驶证姓名区域。经过测试验证,此方法提取完整姓名区域的准确率约为99%。在姓名汉字识别过程中,最重要的是选取神经网络和训练网络模型。由于受实验数据和实验器材的限制,本课题暂时还完成不了对庞大的汉字库中所有汉字类别的...

【文章页数】:74 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 课题来源
    1.2 发展背景及意义
    1.3 国内外研究现状和发展方向
    1.4 本文的研究内容
第二章 相关算法的介绍
    2.1 图像处理
        2.1.1 非均匀光矫正
        2.1.2 倾斜矫正
        2.1.3 二值化
    2.2 姓名区域的定位与提取
        2.2.1 红章定位算法
        2.2.2 提取文字信息区域
    2.3 字符分割与归一化
        2.3.1 基于垂直投影算法的字符分割
        2.3.2 字符尺度归一化
    2.4 本章小结
第三章 参数计算与几种经典神经网络
    3.1 几种工具简介
        3.1.1 TX2开发板
        3.1.2 pycharm编译器
        3.1.3 Opencv库
        3.1.4 Tensorflow
    3.2 参数计算
        3.2.1 卷积参数计算
        3.2.2 BN算法参数计算
    3.3 经典神经网络
        3.3.1 LeNet
        3.3.2 AlexNet
        3.3.3 VggNet
        3.3.4 ResNet
    3.4 本章小结
第四章 基于卷积神经网络的姓名文字识别
    4.1 实验过程
        4.1.1 图像预处理
        4.1.2 大批量生成文字训练集
        4.1.3 汉字识别系统的搭建
    4.2 实验结果与分析
        4.2.1 实验结果
        4.2.2 对实验优化部分的分析
    4.3 本章小结
第五章 总结与展望
    5.1 总结
    5.2 展望
攻读硕士学位期间取得的研究成果
参考文献
致谢



本文编号:3928418

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3928418.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户21dea***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]