基于用户评论的推荐算法研究

发布时间:2023-06-04 02:43
  随着互联网迅速发展,信息数据呈爆炸式增长。为了在海量的数据中挖掘出用户感兴趣的内容信息,推荐算法应运而生。基于用户的协同过滤推荐算法是常用的推荐算法之一,由于存在数据稀疏性问题和冷启动问题,系统的推荐效果差强人意。评论文本含有丰富的产品信息和用户观点,可以用来提高系统的推荐效果,近年来引起了学者们的研究兴趣。本文主要利用评论文本改进基于用户的协同过滤推荐算法,主要的研究内容如下:(1)深入分析评论文本的特点。传统的TFIDF算法应用于评论短文本时,重要词汇和次要词汇的词频分布差别不大,无法有效地提取出文本中的关键信息。针对该问题,本文引入评论数据集中的helpful反馈值,改进了TFIDF算法,从而区分了重要词汇与次要词汇,便于提取关键信息。(2)传统的TextRank算法在抽取关键词时,词汇节点跳转到邻接节点时均分权重,未考虑不同邻接节点的重要性差异。鉴于此,结合改进的TFIDF算法重新引导TextRank算法中权重分配的过程,提高了关键词抽取的准确性。然而,改进后的TextRank算法抽取出的关键词包含很多同义词、重复词,若不进行降维处理则会影响后续用户主题偏好相似度的计算。本文利...

【文章页数】:52 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第一章 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
    1.3 主要的研究内容
    1.4 论文的组织结构
第二章 推荐算法相关技术介绍
    2.1 协同过滤推荐算法
        2.1.1 基于邻域的算法
        2.1.2 基于矩阵分解的算法
    2.2 文本挖掘技术
        2.2.1 文本向量化表示
        2.2.2 SVD奇异值分解
    2.3 本章小结
第三章 评论文本挖掘
    3.1 引言
    3.2 关键词抽取
        3.2.1 改进的TFIDF算法
        3.2.2 TextRank算法
        3.2.3 基于改进的TFIDF的TextRank算法
    3.3实验
        3.3.1 实验环境与实验数据
        3.3.2 评价标准
        3.3.3 实验过程与结果分析
    3.4 本章小结
第四章 结合评论文本和评分的协同过滤推荐算法
    4.1 引言
    4.2 传统的基于用户的协同过滤推荐算法
        4.2.1 方法的不足
        4.2.2 改进思路
    4.3 用户综合相似度计算方法
        4.3.1 项目特征分布与用户主题偏好
        4.3.2 用户评分相似度计算
        4.3.3 用户综合相似度计算
    4.4 评分预测
    4.5 实验及结果分析
        4.5.1 数据集和实验环境
        4.5.2 评价标准
        4.5.3 对比算法
        4.5.4 实验过程与实验结果分析
    4.6 本章小结
第五章 总结与展望
    5.1 总结
    5.2 展望
参考文献
致谢
攻读学位期间的研究成果



本文编号:3830531

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3830531.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户9ae54***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]