基于混合类型数据分析的用户聚类方法研究及应用

发布时间:2023-11-28 19:58
  用户聚类分析的目的是分析核心用户群体的特征,可以应用于精准营销、商业决策、安全预警等领域。有关用户的数据通常是混合型数据,包括数值类型、分类类型和多维非对称特征,即多值离散特征,如兴趣、爱好等。然而,在使用K-means等传统聚类算法对用户进行聚类分析时无法深层次挖掘多值离散特征包含的信息。针对这一问题,本文构建了一种结合关联规则与多值离散特征的聚类方法(A Clustering Method that Combines Association Rule and Multi-valued Discrete Features,ARMDKM),提高了用户聚类的质量。同时,针对当前用户聚类分析没有考虑用户行为之间的关联与重要性的问题,构造了一种基于用户特征重要性的用户聚类算法,提高了聚类分析的准确度。本文主要研究工作如下:1.构建一种结合关联规则的用户聚类方法。当前用户聚类算法无法有效地分析用户数据中存在的多值离散特征,这导致数据的利用率以及用户相似度计算的准确性降低。本文将关联规则(Association Rules,AR)引入到Jaccard距离的计算过程中,构造了一种用户之间相似性度量...

【文章页数】:64 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第1章 引言
    1.1 研究背景及意义
    1.2 国内外研究现状
        1.2.1 用户聚类分析
        1.2.2 无监督特征选择方法
    1.3 存在的问题
    1.4 研究内容及技术路线
        1.4.1 研究内容
        1.4.2 技术路线
    1.5 论文组织结构
第2章 相关理论基础
    2.1 聚类分析
        2.1.1 K-modes算法
        2.1.2 谱聚类
        2.1.3 相似性度量
        2.1.4 聚类质量评价指标
    2.2 关联规则挖掘
        2.2.1 频繁项集
        2.2.2 关联规则
    2.3 随机森林
    2.4 本章小结
第3章 结合关联规则的用户聚类方法
    3.1 改进分析
    3.2 结合关联规则与多值离散特征的用户聚类算法
        3.2.1 ARMDKM算法流程
        3.2.2 基于关联规则和Jaccard距离的相似性度量方法
        3.2.3 聚类中心更新方法
        3.2.4 方法建模
    3.3 实验设计与分析
        3.3.1 实验环境与数据集
        3.3.2 外部评价
        3.3.3 内部评价
    3.4 本章小结
第4章 结合特征重要性的双层用户聚类方法
    4.1 改进分析
    4.2 结合特征重要性的双层用户聚类方法
        4.2.1 TL-FIUC算法流程
        4.2.2 结合K-means++和随机森林的无监督特征选择方法
        4.2.3 基于谱聚类的用户聚类算法
    4.3 实验设计与分析
        4.3.1 实验环境与数据集
        4.3.2 实验分析
    4.4 本章小结
第5章 基于聚类分析的用户群体发现应用
    5.1 应用实例
        5.1.1 数据获取
        5.1.2 聚类数k的确定
        5.1.3 聚类效果分析
    5.2 本章小结
第6章 总结与展望
    6.1 研究工作总结与创新
    6.2 未来研究展望
参考文献
致谢
攻读硕士学位期间从事的科研工作及取得的成果



本文编号:3868838

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3868838.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户ab64f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]