异构信息网络中融合LDA与元路径的用户相关性度量方法研究

发布时间:2023-08-08 18:22
  随着社交网络、新媒体网络、文献网络等由多种类型、相互关联的对象组成的大规模异构网络的急剧发展,异构信息网络(Heterogeneous Information Networks,HIN)分析已经成为数据挖掘中一个重要且热门的研究方向。相关性搜索作为异构网络挖掘中重要研究方向之一,受到越来越多学者的关注。相关性搜索旨在从大规模异构信息网络中挖掘出相关的对等实体,从而为异构网络研究提供依据,尤其是为相关用户推荐工作打下了基础。然而,面对异构信息网络的数据量呈指数级增长的现状,用户往往难以从大量的数据中挖掘出感兴趣的信息,这就是所谓的“信息过载”问题。此问题大大降低了信息的使用效率。通过不同的元路径可以定义对象之间的不同关系,因此基于元路径的实体相关性度量方法应运而生,该方法可以从大量的数据集中发现与查询对象最为相关的对象信息,并且作为开展异构信息网络相关研究的基础与核心,现已在许多实际场景中得到了广泛的应用。目前在基于元路径的相关性方法研究中主要存在两个问题:一是在大规模复杂异构信息网络中,由于节点数目众多、边的类型复杂,无法定义或枚举所有的元路径,使其实体相关性的度量计算效率及准确率都受...

【文章页数】:61 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第1章 绪论
    1.1 研究背景与意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 国内外研究现状
        1.2.1 国外研究现状
        1.2.2 国内研究现状
    1.3 主要研究内容
    1.4 论文的组织结构
第2章 相关工作
    2.1 知识图谱
        2.1.1 知识图谱的建立
        2.1.2 知识图谱的精炼
        2.1.3 知识图谱的数据挖掘
        2.1.4 RDF数据结构
    2.2 异构信息网络
        2.2.1 异构信息网络的基础理论
        2.2.2 元路径
    2.3 LDA主题模型
    2.4 相关性度量方法
        2.4.1 基于特征的相关性度量方法
        2.4.2 基于链接的相关性度量方法
    2.5 本章小结
第3章 基于扩展树的元路径自动生成算法
    3.1 问题的描述
    3.2 基于扩展树的元路径自动生成
        3.2.1 算法框架及描述
        3.2.2 元路径自动生成算法
        3.2.3 权重整合
    3.3 实验分析
        3.3.1 实验环境
        3.3.2 实验数据集
        3.3.3 性能评价指标
        3.3.4 实验结果分析
    3.4 本章小结
第4章 融合LDA与元路径分析的用户相关性度量方法
    4.1 问题的描述
    4.2 融合LDA与元路径分析的用户相关性度量
        4.2.1 基于节点主题的用户相关性度量
        4.2.2 基于元路径的用户相关性度量
        4.2.3 LPUSim方法
        4.2.4 LPUsim方法在推荐中的应用
        4.2.5 复杂度分析
    4.3 实验分析
        4.3.1 实验环境
        4.3.2 实验数据集
        4.3.3 性能评价指标
        4.3.4 实验结果分析
    4.4 本章小结
第5章 总结与展望
    5.1 总结
    5.2 未来工作展望
致谢
参考文献
攻读学位期间发表的学术论文以及参加科研情况



本文编号:3840255

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3840255.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户d5a4a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]