基于卷积神经网络的视频镜头边界检测

发布时间:2023-10-02 02:46
  镜头边界检测是视频语义分析和编辑任务的重要预处理步骤,旨在检测出视频中镜头的切变和渐变,实现对镜头的自动分割;如何高效且准确地识别出视频中的镜头边界仍然是一项挑战。目前大多数镜头边界检测方法基于精心设计的手工特征,检测效果严重依赖于经验确定的参数,可扩展性不强。这些方法往往通过设计更复杂的特征、相似度度量方法或者分类方法以提高检测准确度,计算代价大且实现复杂。针对以上问题,构建了一个基于深度卷积神经网络的镜头边界检测模型。整个模型分为三个阶段。第一阶段初步定位出视频中可能发生镜头切换的位置,使用卷积神经网络的高层输出作为视频帧的特征表示,计算相邻帧之间的差异度,快速排除大部分非镜头边界帧。针对渐变长度多变的特性,采用多个时间尺度对视频进行下采样,然后合并不同尺度下获得的候选边界帧。第二阶段利用三维卷积神经网络识别出候选边界帧中的切变,并基于检测网络输出的渐变概率初步定位出视频中可能发生渐变的位置。第三阶段进一步定位出渐变的时间边界,利用卷积神经网络判断每一帧属于渐变开始、中间和结束三种状态的概率,然后通过定位这三种概率信号的强峰值,确定出渐变过程的起止时间。使用公共数据集ClipSho...

【文章页数】:53 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 绪论
    1.1 研究目的及意义
    1.2 国内外研究现状
    1.3 研究目标及所做的工作
    1.4 论文的组织结构
2 镜头边界初始定位
    2.1 算法描述
    2.2 特征提取
    2.3 实验结果与分析
    2.4 本章小结
3 切变检测
    3.1 检测模型设计
    3.2 网络训练
    3.3 实验结果与分析
    3.4 本章小结
4 渐变检测
    4.1 渐变过程时间定位
    4.2 原始标签转换
    4.3 网络训练
    4.4 实验结果与分析
    4.5 本章小结
5 总结与展望
    5.1 全文总结
    5.2 存在的问题
    5.3 研究展望
致谢
参考文献



本文编号:3849940

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3849940.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户22160***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]