图片多标签分类上的类别不平衡问题研究

发布时间:2023-11-24 23:41
  逻辑回归是多标签分类以及排名任务中最常用的损失形式,但逻辑回归下的Sigmoid交叉熵损失函数受类别不平衡的影响极其严重。这种不平衡主要来自两方面,一是单个类别正例样本与负例样本比例的不均衡,二是各个类别之间样本数量上的巨大差别。这篇文章首先指出了这两种不平衡能通过对分类器输入随机生成的噪声样本来量化,即使噪声样本不能提供任何有助于分类的信息,分类器对噪声样本给出的预测值在各个类之间仍然有显著且稳定的差异。这篇文章认为这些不依赖样本信息的预测差异反映了分类器的推断倾向,并足以作为在类别不平衡学习中校正分类器的依据。传统的类别不平衡学习主要面临两个问题,一是对类别不平衡影响最终预测的深层机制只有定性讨论,缺乏定量分析;二是没有度量模型受类别不平衡影响程度的定量指标。以上两点导致对类别不平衡问题的解决方案大多停留在启发式的加权策略上,缺乏系统的理论依据。这篇文章以图片多标签分类为基准任务,详细地讨论了多标签分类任务下类别不平衡问题的成因,揭示了类别不平衡与推断倾向之间的联系,并提出了用于定量测量推断倾向的噪声统计方案,并在此基础上提出两项Sigmoid交叉熵的改进方案,期望极值平移(ES)...

【文章页数】:55 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 绪论
    1.1 课题研究背景
    1.2 课题研究的目的和意义
    1.3 国内外研究现状
    1.4 论文主要研究内容
    1.5 论文组织结构
2 相关技术
    2.1 基于深度学习的图片特征提取
    2.2 多类与多标签分类
    2.3 类别不平衡学习与难例挖掘
    2.4 本章小结
3 噪声统计方案
    3.1 推断倾向与样本预测
    3.2 噪声统计
    3.3 即时噪声统计
    3.4 本章小结
4 基于噪声统计的交叉熵改进方法
    4.1 交叉熵损失的期望极值点
    4.2 期望极值平移
    4.3 噪声样本约束
    4.4 本章小节
5 实验与结果分析
    5.1 实验介绍
    5.2 结果分析
    5.3 超参数敏感性分析
    5.4 本章小结
6 总结与展望
    6.1 论文工作总结
    6.2 进一步研究方向
致谢
参考文献
附录1 攻读硕士学位期间研究成果



本文编号:3866830

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3866830.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户00472***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]