基于局部成对标签相关性的多标签学习算法及其在知乎话题的应用

发布时间:2023-10-12 02:29
  随着互联网经济的快速发展,知识共享模式已经逐渐成为了信息资源的传递方式。知识型问答社区是一种基于知识的社交平台,旨在实现信息资源的需求方和供应方之间的分享与匹配。提问者发布问题并给出标签,答问者则根据标签检索到问题并回答。二者的成功匹配依赖于平台的内容分发功能与信息检索系统,精准的标签能够提高用户体验、降低运营成本。目前,知识型社交平台都是由用户根据所提出的问题自行打标签,这种标注方式会造成标签与问题不相关或标签不够准确的问题,降低了平台内容分发效率和用户体验,并造成了一定的人工校验成本。因此有必要设计一种高效的话题标签自动标注算法,以期提高内容分发效率,降低人力成本。知识型社交平台上的标签自动标注问题本质属于多标签文本分类任务,每个问题都可能对应多个标签。多标签文本分类问题主要包括两个难点,其一是文本特征提取过程存在噪声和误差,降低分类模型性能,其二是多标签文本分类任务的标签之间存在许多复杂的语义关系,需要高效的多标签分类算法。深度学习在自动特征提取方面存在显著的优势,被广泛应用于自然语言处理领域。RAkEL是一种高阶的多标签分类算法,能够挖掘高阶的标签关联关系,但是在构建多分类器时...

【文章页数】:64 页

【学位级别】:硕士

【文章目录】:
中文摘要
ABSTRACT
第1章 绪论
    1.1 研究背景及研究意义
    1.2 国内外研究现状
        1.2.1 深度学习在自然语言处理中的发展
        1.2.2 多标签文本分类研究现状
    1.3 研究目标与内容
    1.4 研究创新点
    1.5 研究框架
第2章 文本分类技术与理论
    2.1 文本特征提取
        2.1.1 文本向量表示
        2.1.2 自动编码器
        2.1.3 循环神经网络
    2.2 多标签分类算法
        2.2.1 多标签分类基本概念
        2.2.2 多标签分类的评价准则
        2.2.3 多标签分类算法
    2.3 本章小结
第3章 多标签文本分类模型
    3.1 特征提取模型
    3.2 多标签分类模型
        3.2.1 符号说明
        3.2.2 成对标签相关性
        3.2.3 标签子集生成算法
        3.2.4 修正机制
    3.3 算法流程
    3.4 本章小结
第4章 实验设计与结果分析
    4.1 实验设计与参数设置
        4.1.1 数据预处理
        4.1.2 文本特征提取
        4.1.3 实验设计
    4.2 实验结果分析
        4.2.1 对比实验
        4.2.2 性能分析
        4.2.3 拓展实验
    4.3 实验结论
    4.4 本章小结
第5章 结论与展望
    5.1 研究结论
    5.2 未来展望
参考文献
附录 A
发表论文和参加科研情况说明
致谢



本文编号:3853270

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3853270.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户26dc1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]