基于相关性和图分析理论的主题检测研究

发布时间:2024-02-29 06:05
  得益于互联网技术的快速发展,各种社交网站和电子商务平台应运而生,这些网络平台作为信息载体已经成为人们进行信息分享和维护社会关系不可或缺的一部分。这使得在线文本数量呈现爆炸式增长,如何快速有效地从海量文本信息中检测出有价值的话题及其发展趋势一直是数据挖掘领域关注的热点话题。主题检测和跟踪作为主题分析的代表性方法,旨在从各种文本语料中检测主题及其变化趋势。其中主题检测作为TDT的一个子任务,因能高效检测话题及发展趋势而成为探索突发事件、追踪特定社会活动现象发展趋势的重要工具。一些主题检测研究利用主题模型来检测主题。其中LDA模型因提供了一种更加自然的方式来进行文本表示而被公认是一种有效的算法。但其前提是文档中单词相互独立,没有考虑词/术语的共现问题,阻止了隐含而重要主题的检测。有些研究基于共现关系使用图分析方法进行主题检测。把文本数据转换成基于词语间共现关系的术语图,进而分割出主题。该方法重点关注网络结构而忽略了节点属性,导致生成的主题缺乏意义和语义连贯性。为整合语义关系和共现关系,有研究提出一种基于LDA主题模型和图分析的联合理论框架。能更有效地检测主题,挖掘出重要且稀有的主题。但该方法...

【文章页数】:65 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第一章 绪论
    1.1 研究背景和意义
    1.2 研究现状
        1.2.1 主题模型的研究现状
        1.2.2 社区检测的研究现状
    1.3 本文的研究内容和技术路线
    1.4 本文的组织结构
第二章 相关概念和理论基础
    2.1 图分析理论
    2.2 余弦相似性理论
    2.3 主题模型理论
        2.3.1 LDA主题模型
        2.3.2 CTM主题模型
第三章 主题检测基于LDA余弦相似性的图分析方法
    3.1 LDA-CS-IG模型描述
    3.2 LDA-CS-IG模型生成过程
    3.3 仿真实验
    3.4 小结
第四章 主题检测基于CTM模型的图分析方法
    4.1 CTM-CG理论框架描述
    4.2 CTM-CG处理过程和CorrelationGraph算法描述
    4.3 仿真实验
        4.3.1 CTM-CG模型生成过程
        4.3.2 CTM-CG模型结果分析
    4.4 小结
第五章 总结与展望
    5.1 本文工作总结
    5.2 未来工作展望
参考文献
在校期间发表的论文、科研成果等
致谢



本文编号:3914610

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3914610.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户8337d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]