融入语言学信息的神经机器翻译

发布时间:2023-10-14 08:40
  伴随着全球化的进程,各国之间的经济文化交流日益频繁,在不同文化的碰撞与融合过程中,如何突破语言障碍,让机器完成不同语言之间的自动翻译,最终实现无障碍自由通信,是人们长久以来的梦想。随着深度学习的发展,神经机器翻译系统在翻译质量上取得了长足的进步,其综合性能显著超越了传统的统计机器翻译系统。神经机器翻译系统在对数据进行建模时,仅采用端到端的编码器-解码器框架,未结合丰富的先验性语言学信息。本文尝试将丰富的语言学信息融入到神经机器翻译系统的编码器-解码器框架中,探寻语言学信息的融入内容和融入方法。本文从单词级别,局部级别,句子级别的角度出发,由小到大,将语言学信息融入到神经机器翻译中,旨在提升神经机器翻译译文效果。在将语言学信息融入神经机器翻译模型的过程中:首先,本文从单词的角度出发,将单词的词性信息融入到神经机器翻译模型中,通过在目标端新增词性序列以及共享上下文向量,在解码阶段单词序列和词性序列联合解码,词性序列辅助翻译单词序列的生成,实验结果显示,融入词性信息的神经机器翻译方法可以提升机器翻译译文质量;其次,本文从句子局部级别的角度出发,将局部关联性信息融入到神经机器翻译模型中,通过在...

【文章页数】:64 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 研究背景和研究意义
    1.2 机器翻译研究现状
    1.3 本文研究内容
    1.4 本文组织架构
第二章 机器翻译相关知识
    2.1 序列到序列的神经机器翻译模型
    2.2 带有注意力机制的NMT模型
        2.2.1 编码器
        2.2.2 解码器
        2.2.3 损失函数
    2.3 基于自注意力机制的Transformer模型
    2.4 集束搜索的解码策略
    2.5 机器翻译评价指标
    2.6 数据以及数据处理
第三章 融入词性信息的神经机器翻译
    3.1 引言
    3.2 融入词性信息的神经机器翻译
        3.2.1 词性介绍
        3.2.2 融入词性信息的神经机器翻译模型结构
        3.2.3 解码策略
    3.3 实验设置与实验结果
        3.3.1 实验结果
        3.3.2 解码速度分析
    3.4 本章小结
第四章 倾向近邻关联的神经机器翻译
    4.1 引言
    4.2 倾向近邻关联的神经机器翻译
        4.2.1 倾向近邻关联整体框架
        4.2.2 倾向源端近邻关联的神经机器翻译
        4.2.3 倾向目标端近邻关联的神经机器翻译
        4.2.4 混合近邻关联的神经机器翻译
    4.3 实验
        4.3.1 实验设置
        4.3.2 实验结果
        4.3.3 实验分析
    4.4 本章小结
第五章 融入依存关联指导的神经机器翻译方法
    5.1 引言
    5.2 融入依存关联指导的神经机器翻译
        5.2.1 依存树介绍
        5.2.2 源端关联权重
        5.2.3 整体损失函数定义
    5.3 实验结果和分析
        5.3.1 实验设置
        5.3.2 实验结果与分析
    5.4 本章小结
第六章 总结与展望
    6.1 总结
    6.2 展望
参考文献
攻读硕士学位期间取得科研成果和参与的科研项目
致谢



本文编号:3853979

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3853979.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户003ba***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]