基于检索的高考历史题答案生成方法

发布时间:2024-03-16 11:10
  随着互联网的发展与普及,互联网上产生了海量的信息,人类需要以更简单快速的方式获取信息,过去的搜索引擎逐渐无法满足人类对于信息获取的要求。而自动问答系统,则是一种比搜索引擎更为高级的信息服务形式,系统返回给用户的不再是根据相关度排序的文档列表,而是更为精准的自然语言答案。人工智能技术的飞速发展对自动问答系统产生了巨大的推动作用,也促进了自动问答系统在更细分的领域的推广,在此背景下哈工大参与了国家的高考答题机器人项目。本文希望构建一个面向高考历史简答题的自动答题系统,并重点探索基于检索的答案生成方法在答题系统中的应用。本文的主要研究内容包括:试题分析与知识库分析。本文对高考历史简答题进行统计分析,在此基础上总结出题目的类型以及每种题目类型的特点;通过网络等渠道获得了一定数量的历史语料,并针对这些语料在高考历史模拟试题上分析了知识库中的知识点对高考知识点的覆盖能力。问题和材料关键词提取。为了更加准确地提取关键词,本文融合了多种方法,利用有监督学习的算法来提取问题中的关键词;对于历史简答题中的材料,本文结合历史题特点,利用词性标注的方法提取关键词。候选答案抽取和排序。本文根据问题和材料的关键词...

【文章页数】:58 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第1章 绪论
    1.1 课题研究的背景及意义
    1.2 国内外相关技术研究现状
        1.2.1 自动问答系统研究现状
        1.2.2 自动答题系统研究现状
        1.2.3 自动问答系统的关键问题
    1.3 本文的主要研究内容
    1.4 本文的组织结构
第2章 试题分析与知识库分析
    2.1 引言
    2.2 试题分析
    2.3 知识库分析
        2.3.1 数据采集
        2.3.2 知识库覆盖能力分析
    2.4 系统架构
    2.5 本章小结
第3章 关键词提取模块
    3.1 引言
    3.2 问题预处理
    3.3 问句关键词提取
        3.3.1 关键词提取方法介绍
        3.3.2 基于支持向量机的关键词提取方法
    3.4 材料关键词提取
    3.5 本章小结
第4章 基于检索的答案生成模块
    4.1 引言
    4.2 候选答案抽取
        4.2.1 基于词移距离的相似度计算方法
        4.2.2 语句编码模型介绍
        4.2.3 基于循环神经网络的语句编码模型
        4.2.4 基于自注意力机制的语句编码模型
        4.2.5 问题-答案匹配方法
    4.3 本章小结
第5章 实验结果及分析
    5.1 引言
    5.2 评价指标
    5.3 关键词提取实验分析
        5.3.1 问句关键词提取实验
        5.3.2 材料关键词提取实验
    5.4 语句编码模型实验分析
        5.4.1 语句编码模型训练
        5.4.2 问句匹配实验结果与分析
        5.4.3 候选答案排序实验
    5.5 自动答题系统性能分析
        5.5.1 实验设计及数据
        5.5.2 实验结果及分析
    5.6 本章小结
结论
参考文献
致谢



本文编号:3929570

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3929570.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户ba086***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]