当前位置:主页 > 科技论文 > 自动化论文 >

基于情感词典和深度学习技术的短文本情感分类研究

发布时间:2024-03-18 20:00
  移动4G技术的发展及智能手机的普及,世界各地的用户足不出户就可以在互联网上对电影、商品等进行评价。越来越多的研究者使用自然语言处理技术应对每秒都会增加数GB的文本信息,探究其内在的情感倾向并将其成功应用在社会舆情监督、股票投资等方面。以往的情感分析多是基于情感词典的方法和机器学习的方法,然而这些方法都是基于人工构建的规则和人工抽取的特征之上,人力成本高。另外基于one-hot词的向量表示上面临着“纬度高”、“语义无关”的挑战。随着深度学习在自然语言处理领域中崭露头角,很大程度上解决了上述难题。因此,本文主要研究基于深度学习的词向量表示技术和短文本分类相关技术。论文的主要工作如下。(1)针对以往one-hot词向量表示上维度过高、词语语义无关的问题,采用word2vec工具对词向量进行预训练,进行文本表示。采用这种方法一方面很大程度降低了文本形式表达的维度,另一方面还传达了文本的语义信息,为神经网络模型提供更多的语义信息。鉴于分词时情感词提取的准确性可以影响后续词向量的质量,本文利用jieba分词时可以结合自定义词典提高分词的质量,将以往的情感资源进行整合作为自定义情感词典库,这样可以在...

【文章页数】:69 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
    1.3 本文主要工作内容
    1.4 论文组织结构
2 文本情感分类方法及相关理论技术
    2.1 传统情感分类方法
    2.2 基于深度学习的情感分类
    2.3 语言模型
    2.4 本章小结
3 基于情感词库支持的高质量分词
    3.1 词的向量表示
    3.2 结合自定义情感词库构建高质量分词
    3.3 实验设计与实验结果分析
    3.4 本章小结
4 基于CNN-GRU的情感分类模型
    4.1 CNN-GRU情感分类模型
    4.2 实验设计与实验结果分析
    4.3 本章小结
5 总结及展望
    5.1 论文总结
    5.2 未来展望
参考文献
致谢
攻读硕士期间主要研究成果



本文编号:3931740

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3931740.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户b4449***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]