基于时间序列的UGC数量与质量预测技术研究

发布时间:2023-05-19 01:34
  当前,用户原创内容(User Generated Content,UGC)数量规模庞大、增长迅速,内容千差万别,信息质量良莠不齐。如何实现UGC的高效自动评估并从中获取切实有用的信息,已成为一个极具挑战的问题。本文在分析UGC文本内容的基础上,针对网络论坛中的特定用户建立了基于时间序列预测法的UGC质量预测模型。本文首先介绍了时间序列预测的相关方法、各个方法的基本原理及优缺点,重点研究差分自回归移动平均模型(Autoregressive Integrated Moving Average Model,ARIMA)和神经网络。随后结合多模型融合预测的思想,提出使用融合模型预测UGC数量,并建立小波融合模型预测UGC质量。融合模型思想认为待分析的时间序列由线性部分和非线性部分两部分组成,并使用统计学模型和神经网络分别分析。小波融合模型结合融合模型思想使用线性模型提取时间序列的线性部分,随后使用小波变换方法分析残差部分并使用神经网络分析,预测特定的网络用户发表和回复UGC的质量。本文的实验语料是“天涯论坛——杂谈板块”中的部分UGC。UGC质量是由人工标注法分类,分为“精品贴”和“普通帖”。...

【文章页数】:64 页

【学位级别】:硕士

【文章目录】:
摘要
第一章 绪论
    1.1 课题背景与意义
    1.2 UGC国内外研究现状
    1.3 时间序列预测法国内外研究现状
    1.4 本文的主要研究内容
    1.5 创新点
    1.6 论文组织结构
第二章 相关方法和技术介绍
    2.1 网络爬虫技术
    2.2 TensorFlow系统
    2.3 时间序列预测法
    2.4 本章小结
第三章 UGC数量预测模型研究与实验分析
    3.1 数据预处理
    3.2 基于ARIMA模型的UGC数量预测
    3.3 基于BP神经网络的UGC数量预测
    3.4 基于融合模型的UGC数量预测
    3.5 本章小结
第四章 UGC质量预测模型研究与实验分析
    4.1 特征选取
    4.2 基于小波融合模型的UGC质量预测
    4.3 基于人工神经网络的UGC质量分类预测
    4.4 基于SVM的UGC质量预测
    4.5 本章小结
第五章 UGC行为预测系统
    5.1 UGC行为预测系统设计
    5.2 UGC行为预测系统数据预处理与结果展示
    5.3 UGC行为预测系统更新
    5.4 本章小结
第六章 总结与展望
    6.1 主要工作及创新点
    6.2 研究展望
参考文献
致谢
攻读学位期间取得的研究成果



本文编号:3819397

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3819397.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户6f36f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]