社交网络短文本的分类方法研究

发布时间:2024-04-08 04:06
  社交网络中的丰富信息,使之成为数据挖掘技术的研究热点。通过数据挖掘技术可以对灾害事件、民众舆情、可疑用户账号等进行监控,从而提升相关机构的灾害防御和救援能力,实现更智能的政治决策等。但社交网络数据的低信噪比等特点,并且现有的数据挖掘技术中较少考虑噪声的影响,价值信息被垃圾信息所掩盖,影响数据挖掘的效果。通过对社交网络短文本数据进行分类,过滤垃圾数据,保留价值数据,可以为数据挖掘提供更干净的输入数据,从而提升数据挖掘的效果。社交网络数据具有长度短、内容少、特征选择单一且特征表达能力弱等特点,因此传统的文本分类方法在社交文本分类应用中效果不好。并且现有文本分类方法多采用有监督学习的方法来实现,但有监督方法为构建良好的分类模型,对标注数据集的大小和质量有很高的依赖性,但实际工作中往往存在标注数据不足、标注困难、标注代价高昂等问题,这导致现有方法很难获得社交网络短文本的准确分类结果。本文针对上述二个问题开展研究,主要贡献概括如下:1.提出基于多属性特征的社交网络短文本分类方法。在特征抽取阶段,在传统的文本语义特征基础上,通过分析数据的特点,抽取了社交属性和结构属性作为语义属性的重要补充特征,解...

【文章页数】:79 页

【学位级别】:硕士

【部分图文】:

图3前沿领域系统化工程训练体系

图3前沿领域系统化工程训练体系

表2人工智能领域案例知库企业学校案例开发实践——美食分类智能小车远程监控系统设计案例开发实践——垃圾分类智能小车系统避障系统设计案例开发实践——口罩检测基于深度强化学习的任务调度案例开发实践——安全帽检测基于TSN的智能小车传感器和作动器实验板设计案例开....



本文编号:3948466

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3948466.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户7e0b3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]