基于机器学习的网络伪舆情的分类及识别

发布时间:2024-02-29 20:52
  在人们都更倾向于使用移动互联、智能手机的今天,对于网络信息的态度表达也更加快捷、直接,网络成为大众舆情的主要载体,网络舆情应运而生。然而任何事物都有两面性,网络伪舆情也随之出现,并影响和扰乱人们的生活、企业的运作和政府的决策,为了减少其恶劣影响、提升网民的网络体验和优化网络环境,不仅要从稂莠不齐的网络舆情环境中快速识别伪舆情事件,还要对网络伪舆情进行精准分类,让相关部门能“对症下药”。本文以网络热门事件的传播数据为研究对象,使用机器学习的分类和聚类模型以达到上述目的,具体研究内容如下:(1)介绍网络伪舆情分类和识别研究的背景及意义,阐述业内对网络伪舆情的研究现状,总结出指标选取存在事后性、模型选择单一、实际应用效果不清楚等缺陷,然后提出本文的研究方向。(2)分时段、分渠道采集网络舆情事件的实时传播趋势数据,即统计各小时内各个渠道中高影响力用户的传播次数,然后分别绘制真实舆情事件和伪舆情事件的传播趋势图,根据趋势图的区别选取和量化得到第一类指标,包括有效传播时间、热议次数、单位时间内传播量、分渠道占比、传播渠道离散程度等;第二类指标描述的是信息源特征,包括来源渠道和用户影响力指数。然后选...

【文章页数】:52 页

【学位级别】:硕士

【部分图文】:

图1.1网络伪舆情识别框架图

图1.1网络伪舆情识别框架图

4第二,对网络伪舆情的内部细分,现有研究仅局限在对特征的文本分析和人工分类。鉴于伪舆情的细分会影响着后续治理措施的效果,本文将从网络伪舆情的特征入手,构建一个全新的指标体系,再使用聚类算法对网络伪舆情进行分类,根据聚类结果中的聚类中心分析网络伪舆情的数据特点,以数据为驱动为网络伪....


图1.2网络伪舆情分类框架图

图1.2网络伪舆情分类框架图

5为了解决现有网络伪舆情识别研究使用的数据指标存在事后性的这一问题,在第一部分本文将基于舆情事件的传播趋势构建实时的指标体系,对于每一个影响力指数大于额定阈值的舆情事件进行监控,采集从事件开始截至数据采集时的全部传播趋势数据,不再使用整体指标,侧重于数据的及时性,然后分析真实舆情....


图3.1事件“北京大兴国际机场投运仪式举行”传播趋势图

图3.1事件“北京大兴国际机场投运仪式举行”传播趋势图

133.2构建舆情事件指标体系3.2.1传播趋势数据分析为了更直观的发现网络伪舆情区别于真实舆情的特点,根据舆情事件的传播趋势数据使用Python画出折线图并对比分析。以“北京大兴国际机场正式投运”事件为例:2019年9月25日,北京大兴国际机场投运仪式举行,那么数据搜集就确定从....


图3.2事件“情侣相约玉龙雪山跳崖殉情”传播趋势图

图3.2事件“情侣相约玉龙雪山跳崖殉情”传播趋势图

14图3.2事件“情侣相约玉龙雪山跳崖殉情”传播趋势图对比观察多个事件的趋势图可以发现,网络伪舆情事件的传播趋势与真实舆情的传播趋势有着明显差别,例如真实舆情的传播趋势中有多个峰值,热度分散,而伪舆情事件热度较为集中,另外从传播渠道可以发现,伪舆情事件中微博占比大,换句话说就是渠....



本文编号:3914911

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3914911.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户c1b73***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]