基于多源异构数据的中文旅游知识图谱构建方法研究

发布时间:2023-08-29 20:33
  在大数据时代背景下,互联网的信息数量呈现指数式的增长趋势,如何从这些海量数据中高效并准确地挖掘出有用的信息已经成为了信息检索的研究热点之一。知识图谱(Knowledge Graph)以图结构的形式描述存在于真实世界中的实体与实体间关系,并通过大数据提炼出知识库,能够对数据进行智能地组织和整合,是为搜索引擎提供精准答案的技术基础。知识图谱的构建研究在海量互联网知识的识抽取以及知识组织管理上体现了重要的应用价值。目前存在的知识图谱多为面向全领域的通用知识图谱,强调知识的广度,但是缺乏对实体知识深层次的挖掘。并且针对性较强的领域知识图谱,尤其是旅游领域的知识图谱研究很少且起步较晚,且没有较好的构建以及表示方法。已经构建好的旅游知识图谱,大都仅基于百科知识进行构建,导致知识较单一,尚不具有扩展性,适用性较差。针对这些问题,本文研究从多源异构数据中构建中文旅游领域知识图谱并探索其应用。本文研究内容包括:旅游知识图谱的数据来源分析,并对不同来源数据进行知识抽取、多源异构数据的实体对齐,以及旅游知识图谱的应用研究三部分,具体介绍如下:(1)为了构建出一个高质量的旅游知识图谱,本文首先针对互联网中的各...

【文章页数】:71 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第1章 绪论
    1.1 研究背景和意义
    1.2 知识图谱相关研究现状
        1.2.1 知识图谱研究现状
        1.2.2 知识抽取研究现状
        1.2.3 实体对齐研究现状
    1.3 研究内容
    1.4 论文组织结构
第2章 多源异构的中文旅游知识抽取
    2.1 知识来源分析
    2.2 基于百科站点的知识抽取
        2.2.1 基于百科页面的半结构化知识抽取
        2.2.2 基于百科页面的非结构化知识抽取
    2.3 基于垂直网站知识抽取
    2.4 基于CRF和候选句的属性扩充
        2.4.1 基于infobox构建属性词表
        2.4.2 候选句选择
        2.4.3 基于CRF和候选句的实体属性值抽取
        2.4.4 实验及实验结果分析
    2.5 本章小结
第3章 知识图谱中的知识融合
    3.1 知识图谱中的实体对齐
    3.2 基于神经网络的词向量表示技术
        3.2.1 Skip-gram模型和CBOW模型
        3.2.2 Directional Skip-Gram(DSG)模型
        3.2.3 基于BERT模型的词向量表示技术
    3.3 基于BERT的实体对齐实验
    3.4 本章小结
第4章 基于旅游领域知识图谱的应用
    4.1 旅游知识图谱的知识库整理与存储
    4.2 基于旅游领域知识图谱的搜索应用
        4.2.1 基于关键字模式匹配
        4.2.2 关键词同义词典构建
        4.2.3 基于模式匹配和旅游知识库的搜索
    4.3 中文旅游知识图谱的可视化系统
    4.4 本章总结
第5章 总结和展望
    5.1 全文总结
    5.2 展望
参考文献
致谢
攻读硕士学位期间研究成果



本文编号:3844237

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3844237.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户27d7f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]