基于多级相似度和信息核的协同过滤推荐算法研究

发布时间:2024-02-03 04:14
  随着信息技术的迅速发展和普及,数据资源以指数级别的速度增加,这使得用户在面对众多的网络资源时,反而无法高效选择出对自己有用的信息,进而出现信息超载问题。于是推荐系统应运而生,它依据用户的历史数据,通过用户的兴趣爱好来进行独特的个性化分析、计算,从而为用户提供有用的信息。现今推荐系统已广泛应用到社交网站,电子商务,电子学习,电影推荐和旅游等诸多领域。随着对推荐系统的深入研究,相应的研究难题也显露出来,例如对于新注册的用户,系统为其作推荐时的冷启动问题;用户评分矩阵中的数据稀疏性问题;随着用户和物品数目激增而带来的系统可扩展性问题,以及大多数算法只注重推荐相似物品而缺乏多样性的问题等等,这都影响了推荐系统的进一步发展。本文就协同过滤系统由于数据量增多而导致的日益严重的可扩展性问题、算法耗时长以及相似度函数度量准确性等问题,进行了如下内容的研究:(1)针对协同过滤推荐中存在的可扩展性问题,本文使用了提取信息核的方法。即将一个用户集的所有用户进行训练,提取出携带信息最具价值的核心用户组成信息核,这一过程为离线操作,这使得在计算用户相似度时,会大大节省内存和时间消耗。本文在原有基于频率(Freq...

【文章页数】:58 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 绪论
    1.1 研究背景及意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 国内外研究现状
        1.2.1 国内研究现状
        1.2.2 国外研究现状
    1.3 论文工作内容及章节安排
2 相关理论知识
    2.1 非协同过滤推荐概述
        2.1.1 基于内容的推荐
        2.1.2 基于知识的推荐
        2.1.3 混合集成的推荐
    2.2 协同过滤推荐概述
        2.2.1 基于用户的协同过滤
        2.2.2 基于物品的协同过滤
        2.2.3 基于模型的协同过滤
    2.3 信息核概述
    2.4 推荐算法性能评价
        2.4.1 用户相似度
        2.4.2 数据集
        2.4.3 评价标准
    2.5 本章小结
3 基于优化信息核的协同过滤推荐算法
    3.1 信息核提取问题描述
        3.1.1 基于频率(FB)的算法模型
        3.1.2 基于排名(RB)的算法模型
    3.2 优化的信息核提取方法
        3.2.1 优化的基于频率(IFB)的算法模型
        3.2.2 优化的基于排名(IRB)的算法模型
    3.3 实验结果与分析
        3.3.1 实验数据集
        3.3.2 实验环境
        3.3.3 实验方案
        3.3.4 实验结果及分析
    3.4 算法时间复杂度
    3.5 本章小结
4 基于多级相似度的协同过滤推荐算法
    4.1 经典皮尔逊相关系数问题描述
    4.2 多级相似度
        4.2.1 基本思想
        4.2.2 参数调节
    4.3 实验结果与分析
        4.3.1 实验方案
        4.3.2 实验结果及分析
    4.4 本章小结
5 总结与展望
    5.1 工作总结
    5.2 未来展望
致谢
参考文献
攻读学位期间的研究成果



本文编号:3893702

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3893702.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户f6a19***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]