面向文献著者的跨文本指代消解研究

发布时间:2023-09-02 12:55
  在科学研究领域,通过文献著者搜索相关信息是学术信息检索的主要方式。然而,在各类文献管理系统中,文献著者的跨文本指代现象非常严重,给学术信息检索带来了诸多困难。例如:如何消除不同文献之间的同名作者歧义性问题,即:重名消歧;如何消除不同文献之间的作者指代不统一问题,即:多名聚合。在解决重名消歧问题时,已有方法主要通过作者合作关系、作者主页、邮箱等信息对重名作者进行分类。由于作者的邮箱和主页信息很难获取,如何在这些信息未知的情况下,准确的划分文献著者类别,是重名消歧需要解决的核心问题。此外,文献著者名字的表示形式多样,甚至存在未知形式的名字变体。因此,如何在名字变体未知的情况下,实现多名聚合是跨文本指代消解所面临的又一问题。针对上述问题,本文的主要研究内容如下:(1)提出了基于网络表示学习的重名消歧算法。该方法可以在作者邮箱、主页等信息不可获取,以及作者具体类别个数未知的情况下,解决文献著者重名消歧问题。首先,利用待消歧作者的多阶合作者及论文-作者关系,构建论文-论文网络。其次,通过图网络学习得到论文的特征向量表示。最后,利用论文之间的关系网络,实现文献著者的重名消歧。(2)提出了基于特征相...

【文章页数】:60 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第1章 绪论
    1.1 研究背景及意义
    1.2 研究现状
    1.3 本文研究内容
    1.4 本文组织结构
第2章 相关工作及算法综述
    2.1 跨文本指代消解简介
    2.2 网络表示学习简介
    2.3 重名消歧的相关研究
        2.3.1 基于特征聚类方式的重名消歧
        2.3.2 基于树方式的重名消歧
        2.3.3 基于图方式的重名消歧
        2.3.4 其他
    2.4 多名聚合的相关研究
    2.5 本章小结
第3章 基于网络表示学习的重名消歧算法
    3.1 基本思想
    3.2 问题定义
        3.2.1 基本定义
        3.2.2 重名消歧任务定义
    3.3 模型框架
        3.3.1 模型定义
        3.3.2 模型优化
    3.4 聚类
        3.4.1 AP聚类算法
        3.4.2 DBSCAN算法
    3.5 实验结果与分析
        3.5.1 数据集
        3.5.2 对比算法
        3.5.3 实验设置
        3.5.4 实验结果
    3.6 本章小结
第4章 面向文献著者的多名聚合算法
    4.1 基本思想
    4.2 问题定义
    4.3 基于特征相似度的多名聚合算法
        4.3.1 构建作者名字变体
        4.3.2 构建论文关键词
        4.3.3 关键词相似度计算
        4.3.4 作者相似度计算
        4.3.5 期刊相似度计算
    4.4 基于监督学习的多名聚合算法
        4.4.1 构建名人库
        4.4.2 论文标题匹配
        4.4.3 BLEU算法
        4.4.4 论文作者匹配
        4.4.5 人工标注
    4.5 实验结果与分析
        4.5.1 数据集
        4.5.2 对比算法
        4.5.3 实验设置
        4.5.4 实验结果
    4.6 本章小结
第5章 跨文本指代消解算法的应用
    5.1 学术头条
    5.2 基于网络表示学习的重名消歧算法的应用
    5.3 基于特征相似度的多名聚合算法的应用
    5.4 本章小结
第6章 总结与展望
    6.1 工作总结
    6.2 工作展望
参考文献
作者简介及科研成果
致谢



本文编号:3845241

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3845241.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户1fc79***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]