基于图结构的实体关系抽取方法研究

发布时间:2024-04-12 06:19
  网络的快速发展产生大量的非结构化文本信息,成为巨大且不断增长的信息源,如何快速准确地从这些网络信息中得到人们想要的知识,并将其规范为结构化数据,已受到广泛的关注,给关系抽取研究也带来了新的机遇和挑战,成为学术界的一个重要前进方向。该方向的研究主要是结合机器学习算法与深度学习算法共同完成对实体对间的关系进行抽取任务。基于目前的研究现状来看,大多数关系抽取方法存在关系分类粗糙、选取的特征较多等问题,同时抽取效果不尽理想,时间成本较高。本文在选取较少特征的基础上,将关系抽取任务转化为触发词提取和关系抽取两个部分实现,达到了良好的抽取效果。第一部分是关系触发词的提取。在槽填充算法的基础上,提出基于图的关系触发词提取方法。增加介词过滤模块,判断实体对间一定距离内的介词是否为触发词,减少整体的运行时间;利用依存句法分析器将句子实例连接成图,利用Page Rank算法计算图中每个节点相对于实体的重要性分数,通过对比实验选择算法中的最优参数值;关联规则挖掘算法计算各节点与实体对间规则的置信度,用来影响综合重要性分数;改进槽填充方法中的综合分数计算,使用各节点相对于实体对的Page Rank重要性分数与...

【文章页数】:66 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第1章 绪论
    1.1 研究背景和意义
    1.2 研究现状
    1.3 研究内容
    1.4 本文组织结构
第2章 关系抽取关键技术简介
    2.1 实体关系基础知识
        2.1.1 实体
        2.1.2 实体关系
        2.1.3 数据集
    2.2 关系抽取算法介绍
        2.2.1 有监督学习抽取方法
        2.2.2 半监督学习抽取方法
        2.2.3 无监督学习抽取方法
    2.3 算法评测标准
    2.4 本章小结
第3章 基于图结构的关系触发词提取
    3.1 触发词基本概念
    3.2 触发词提取基本方法
        3.2.1 基于词典的触发词提取方法
        3.2.2 基于统计的触发词提取方法
    3.3 基于图结构的触发词提取方法
        3.3.1 依存句法分析
        3.3.2 PageRank
        3.3.3 AP聚类算法
        3.3.4 过滤模块
        3.3.5 关联规则挖掘
        3.3.6 综合重要性分数计算
        3.3.7 基于图结构的触发词提取方法
    3.4 实验介绍与分析
        3.4.1 实验数据集介绍
        3.4.2 触发词结果展示
        3.4.3 参数选取
    3.5 本章小结
第4章 实体关系抽取方法中分类器的选择
    4.1 支持向量机
        4.1.1 SVM基本思想
        4.1.2 SVM多分类分类器
    4.2 前馈神经网络
        4.2.1 前馈神经网络基本概念
        4.2.2 激活函数
        4.2.3 多层前馈神经网络
    4.3 循环神经网络
        4.3.1 RNN
        4.3.2 LSTM
        4.3.3 GRU
    4.4 实验结果与分析
        4.4.1 实验一:窗口大小选择实验
        4.4.2 实验二:关系抽取分类器对比实验
        4.4.3 实验三:不同数据集对比实验
        4.4.4 实验四:与其他算法对比实验
        4.4.5 实验五:人物知识图谱系统设计与实现
    4.5 本章小结
第5章 总结与展望
    5.1 工作总结
    5.2 未来展望
参考文献
作者简介及在学期间所取得的科研成果
致谢



本文编号:3951796

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3951796.html

上一篇:基于风格迁移的图像分类技术研究  
下一篇:没有了

Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户67c9f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]