当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于深度学习的自然英文文字识别的研究

发布时间:2024-02-03 03:20
  文字作为自然场景中常见的信息承载形式,其中往往蕴含着丰富的语义特征信息,本文针对自然场景中的英文文字识别问题进行了研究。区别于传统OCR方法适用的文档图像等,自然场景下采集的文本图像往往存在着字体多变、排版不规律以及环境背景复杂等难点,为识别过程引入了诸多不定因素。如何让计算机能更精准无误地提取特征、识别文字一直是国内外诸多学者研究的热点问题。随着深度学习理论不断发展进步,其应用领域逐步扩展,在图像处理、预测分类等诸多方向上取得了不错的成效。本文以深度学习理论为基础,以自然场景下的英文文字识别为目标,以文字识别准确率及效率为标准,对场景下的英文文字的识别展开了研究。主要内容如下:(1)结合端到端的识别模型思想,在编码器-译码器框架下,设计了一套基于CNN-BiGRU-Attention的场景英文文字识别算法模型。从整体上将识别任务分解为编码以及译码两个流程,以此展开对各部分算法的研究与设计。(2)在编码环节中,在完成图像预处理的基础上,结合Jaderberg的卷积神经网络,给出了用于图像局部静态特征提取的卷积神经网络模型。为更进一步利用文字间上下文关联信息,引入双向循环神经网络以提取关...

【文章页数】:85 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
        1.2.1 自然场景下文字识别的挑战
        1.2.2 文字检测研究现状
        1.2.3 文字识别研究现状
    1.3 论文的主要内容与结构
        1.3.1 论文的主要研究内容
        1.3.2 论文的章节安排
第二章 相关技术框架
    2.1 深度学习理论
        2.1.1 深度神经网络
        2.1.2 卷积神经网络
        2.1.3 循环神经网络
    2.2 TensorFlow
    2.3 本章小结
第三章 场景文本识别总体方案及预处理
    3.1 方案概述
        3.1.1 编码器-译码器框架
        3.1.2 总体方案设计
    3.2 图像预处理
        3.2.1 图像灰度化
        3.2.2 灰度归一化
        3.2.3 图像尺寸统一
    3.3 本章小结
第四章 编码算法的研究
    4.1 研究基础
        4.1.1 编码模块的任务与作用
        4.1.2 基于CNN提取局部静态特征及其局限性
    4.2 编码算法的优化
        4.2.1 基于BiRNN网络的上下文特征提取
        4.2.2 BiRNN网络效率的优化
        4.2.3 基于CNN-BiRNN的网络设计
        4.2.4 编码向量生成算法
    4.3 本章小结
第五章 译码算法的研究
    5.1 研究基础
        5.1.1 译码模块的任务与作用
        5.1.2 基于RNN译码的局限性
    5.2 译码算法的优化
        5.2.1 基于注意力机制的译码算法
        5.2.2 注意力机制的性能改进
        5.2.3 基于局部注意力机制的译码算法
        5.2.4 基于字典模型优化的后处理算法
        5.2.5 基于n-gram语言模型优化的后处理算法
    5.3 本章小结
第六章 实验结果
    6.1 实验环境及数据集
    6.2 实验结果及分析
        6.2.1 实验流程
        6.2.2 训练过程优化的实验结果
        6.2.3 模型性能及测试集实验结果
        6.2.4 CNN-BiRNN编码性能的实验结果
        6.2.5 改进后局部注意力机制的实验结果
        6.2.6 改进后集束搜索的实验结果
        6.2.7 本文模型与其他模型比较结果
    6.3 本章小结
第七章 总结与展望
    7.1 研究总结
    7.2 未来展望
致谢
参考文献
攻读硕士学位期间取得的成果



本文编号:3893626

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3893626.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户cfbe1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]