面向会议纪要的抽取式摘要生成研究

发布时间:2023-11-15 20:10
  随着互联网技术的发展,信息的指数级爆炸导致人们难以高效获得信息资源,自动文本摘要技术也因此得到了广泛的关注。与常见的单文档摘要问题不同,会议文本存在单人发言和多人对话两种不同的形式,且存在信息冗余与内容不连贯等特点。特别是在当前疫情状况下,在线会议的需求暴增,会议的自动摘要变得更加重要。抽取式摘要又比生成式摘要有着稳定性好、可读性强等优点。本文针对面向会议纪要的抽取式摘要生成研究这一课题,提出了两种不同结构的抽取式摘要模型与融合模型,并面向对话类会议提出了一种新颖的用户特征建模方法。主要包含以下三个方面内容:基于多任务学习的序列抽取模型、基于强化学习的端到端句子抽取模型和基于条件变分自编码器的用户特征建模技术。基于多任务学习的序列抽取技术使用了一种序列抽取模型,且考虑到更好的利用输入文本的段落信息,基于序列抽取模型又使用了多任务学习进行共同训练,一定程度上共享相关信息,以提升目标任务。实验结果表明基于多任务学习的序列抽取模型在本课题数据集上达到了令人满意的效果,证明了该方法的有效性。基于强化学习的端到端句子抽取模型使用了一种与基于多任务学习的序列抽取技术不同的模型结构,该模型使用编码器...

【文章页数】:57 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 课题背景及研究意义
        1.1.1 课题背景
        1.1.2 研究意义
    1.2 国内外研究现状
        1.2.1 抽取式摘要方法
        1.2.2 用户特征建模技术
        1.2.3 国内外研究现状简析
    1.3 本文研究内容及章节安排
        1.3.1 本文研究内容
        1.3.2 本文章节安排
第2章 基于多任务学习的序列抽取模型
    2.1 引言
    2.2 基于层级编码器的序列抽取模型
    2.3 基于BERT的序列抽取模型
    2.4 基于多任务学习的序列抽取模型
    2.5 实验与分析
        2.5.1 实验数据
        2.5.2 实验设置
        2.5.3 评价指标
        2.5.4 实验结果
    2.6 本章小节
第3章 基于强化学习的端到端句子抽取模型
    3.1 引言
    3.2 基于端到端的句子抽取模型
    3.3 基于ELMO的句子抽取模型
    3.4 基于强化学习的端到端句子抽取模型
    3.5 实验与分析
        3.5.1 实验数据
        3.5.2 实验设置
        3.5.3 评价指标
        3.5.4 实验结果
    3.6 模型融合
    3.7 本章小节
第4章 基于条件变分自编码器的用户特征建模技术
    4.1 引言
    4.2 基于CVAE的用户特征建模技术
    4.3 基于LSTM的用户特征建模技术
    4.4 实验与分析
        4.4.1 实验数据
        4.4.2 基线模型
        4.4.3 对比实验
        4.4.4 实验设置
        4.4.5 评价指标
        4.4.6 实验结果
    4.5 本章小结
结论
参考文献
致谢



本文编号:3864429

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3864429.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户5f3ce***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]