基于强化学习的实体关系联合抽取模型研究

发布时间:2024-02-28 21:59
  实体识别与关系抽取是信息抽取中的一项重要任务。目前主流的做法是将实体关系进行联合抽取,现有的基于远程监督的实体和关系抽取方法存在着标签噪声问题。本文提出了一种基于强化学习的实体关系联合抽取方法。该模型有两个模块:句子选择器模块和实体关系联合抽取模块。句子选择器模块选择没有标签噪声的高质量句子,将所选句子输入到实体关系联合抽取模型。实体关系联合抽取模块采用序列标注方法,对输入的句子进行预测,并向句子选择器模块提供反馈,指导句子选择器模块挑选高质量的句子。这两个模块共同训练来优化句子选择和序列标注过程。实验结果表明,该模型能有效地处理数据的噪声,在实体和关系联合抽取上有较好的效果。本文的主要研究内容包括以下几个方面:(1)针对远程监督的公开数据集,使用一种可以同时将实体与关系的信息抽取出来的标签,将数据集进行预处理,在处理之后的数据集上可以将实体关系联合抽取转换成序列标注问题,也就是通过含有足够信息的标签可以在一个模型中同时抽取出实体与关系。(2)将实体关系联合抽取转化为一个统一的序列标注问题后,研究了多种序列标注模型,包括经典的BI-LSTM-CRF模型,将CRF解码器换成LSTM解码器...

【文章页数】:64 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
1 绪论
    1.1 研究背景与研究意义
    1.2 国内外相关领域研究现状
        1.2.1 命名实体识别的相关工作
        1.2.2 关系分类的相关工作
        1.2.3 实体关系联合抽取的相关工作
    1.3 本文研究目标与研究内容
    1.4 本文的组织结构
2 语料库的构建
    2.1 远程监督
    2.2 标签策略
    2.3 词向量
    2.4 本章小结
3 序列标注模型
    3.1 条件随机场(CRF)模型
    3.2 神经网络模型
        3.2.1 循环神经网络(RNN)模型
        3.2.2 长短期记忆网络(LSTM)模型
        3.2.3 双向长短期记忆网络(BI-LSTM)模型
    3.3 神经网络与条件随机场的联合模型
    3.4 基于损失函数优化的LSTM解码器
    3.5 基于注意力机制的LSTM解码器
    3.6 本章小结
4 基于强化学习的实体关系联合抽取模型
    4.1 任务描述
    4.2 模型构建
        4.2.1 强化学习模型
        4.2.2 词向量模型
        4.2.3 双向长短期记忆模型
        4.2.4 条件随机场模型
    4.3 训练过程
    4.4 本章小结
5 实验与结果分析
    5.1 实验环境
    5.2 数据集
    5.3 评价指标
    5.4 实验设置
    5.5 实验结果
    5.6 实例分析
    5.7 错误分析
    5.8 本章小结
6 总结与展望
    6.1 总结
    6.2 展望
参考文献
致谢



本文编号:3914040

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3914040.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户77ac2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]