多样化场景中的半监督视频目标分割算法研究

发布时间:2023-09-14 03:33
  视频目标分割是场景理解的基础,对计算机视觉中多个领域的研究具有重要意义,包括动作识别、自动驾驶汽车、目标跟踪等。半监督的视频目标分割方法根据给定的第一帧掩码标注,自动地分割后续视频帧中的目标,需要的人工干预少。近年来卷积神经网络的发展和大型数据集的出现使视频目标分割的精度得到了显著提升。然而大部分精度较高的半监督算法依赖于在线微调过程,增加了额外的时间代价。由于视频场景多样化,一方面目标在表观和尺度上会随时间发生改变,另一方面当视频中存在多个相似物体时,容易引起分割误差。除此之外,目标被遮挡或者暂时超出视野时,一些过于依赖上一帧分割结果的方法可能丢失目标。本文针对该领域的难点和现有方法的缺点,提出了两种不同思路的半监督视频目标分割算法。针对目标表观和尺度变化较大的场景以及存在相似性物体的场景,本文提出了多特征指导的视频目标分割算法。利用第一帧、前一帧和当前帧目标的表观信息构建全局表观匹配特征和局部表观匹配特征,捕获视频中目标的变化。同时估计像素到目标中心的偏移量构建目标中心图,区分不同位置的目标,特别是相似性目标。这三种信息与特征提取网络得到的主干特征进行组合,指导模型实现精确的视频目...

【文章页数】:81 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 绪论
    1.1 课题研究的背景和意义
    1.2 国内外研究概况
    1.3 论文的研究内容
    1.4 本文的组织结构
2 卷积神经网络与视频目标分割技术
    2.1 引言
    2.2 卷积神经网络
    2.3 视频目标分割算法分析
    2.4 视频目标分割评价指标
    2.5 本章小结
3 多特征指导的视频目标分割算法研究
    3.1 引言
    3.2 算法整体框架
    3.3 多特征指导的视频目标分割算法
    3.4 实验结果与分析
    3.5 本章小结
4 抗丢失的视频目标分割算法研究
    4.1 引言
    4.2 算法整体框架
    4.3 抗丢失的视频目标分割算法
    4.4 实验结果与分析
    4.5 本文算法总结
    4.6 本章小结
5 总结与展望
    5.1 全文总结
    5.2 课题展望
致谢
参考文献
附录1 攻读学位期间发表论文与参与课题



本文编号:3846472

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3846472.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户0af75***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]