面向开放域问答的阅读理解技术研究

发布时间:2024-01-25 19:39
  本课题主要研究阅读理解技术在开放域问答系统中的应用,并设计了结合检索系统和阅读理解技术的问答系统,期望通过这种模式推动阅读理解技术的应用落地。开放域是指提问内容是不限定领域的。阅读理解技术是近几年来新兴的一种答案抽取技术,通过预测答案开始和结束位置来定位精确答案。本课题选择Du Reader作为实验数据,因为Du Reader中的问题是从搜索引擎真实的用户搜索记录中整理出来的,相比刻意标注的问题数据,这种问题能够真实客观的反映问答系统的需求,实验结果也能够更真实地反映实际应用效果。本课题的研究内容主要有以下几个方面,首先,本课题设计了面向多篇章的阅读理解模型。所谓多篇章指的是每个问题对应的候选篇章不止一个,而目前大多数阅读理解任务都是围绕单篇章展开的。多篇章能够显著提高答案的召回率,提高了检索系统的容错率。为了解决多篇章阅读理解任务,本课题基于当前单篇章阅读理解的模型,做了面向多篇章的改进。其次,我们发现模型定位答案篇章,对于模型定位答案具有至关重要的意义,而简单地将模型设计为先定位篇章,再定位答案的模式又容易造成误差累计。于是我们通过为模型增加一个篇章排序子任务,训练时采用多任务学习...

【文章页数】:53 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 课题背景及研究目的和意义
        1.1.1 课题的来源
        1.1.2 课题研究的背景和意义
    1.2 国内外研究现状
        1.2.1 国内研究现状
        1.2.2 国外研究现状
        1.2.3 国内外研究现状简析
    1.3 主要研究内容
    1.4 本文章节安排
第2章 面向多篇章的阅读理解模型
    2.1 引言
    2.2 DuReader数据介绍
    2.3 DuReader数据预处理
        2.3.1 文档处理
        2.3.2 答案片段处理
    2.4 面向多篇章的阅读理解模型设计
        2.4.1 模型结构设计概览
        2.4.2 Encoder层介绍
        2.4.3 Pointer Network介绍
    2.5 实验结果及分析
        2.5.1 数据预处理相关实验
        2.5.2 不同Encoder层相关实验
    2.6 本章小结
第3章 面向多任务学习的阅读理解模型
    3.1 引言
    3.2 面向多任务学习的阅读理解模型设计
        3.2.1 多任务学习在本课题中的应用
        3.2.2 模型结构设计概览
        3.2.3 人工特征提取
    3.3 实验结果及分析
    3.4 本章小结
第4章 面向多领域的阅读理解模型
    4.1 引言
    4.2 多领域数据构建
    4.3 迁移学习
    4.4 基于预训练模型的迁移学习
    4.5 基于对抗学习的领域自适应学习框架
        4.5.1 对抗学习
        4.5.2 模型设计
    4.6 实验结果及分析
    4.7 本章小结
第5章 基于阅读理解的开放域问答系统设计与实现
    5.1 引言
    5.2 检索系统设计与实现
        5.2.1 离线检索系统
        5.2.2 在线检索系统
    5.3 问答系统设计实现
        5.3.1 问答系统设计
        5.3.2 问答系统实现
    5.4 实验结果及分析
    5.5 本章小结
结论
参考文献
攻读硕士学位期间发表的论文及其它成果
致谢



本文编号:3885438

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3885438.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户1caf9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]