多人场景下的特定人目标跟踪算法研究

发布时间:2024-04-25 01:06
  基于计算机视觉的目标跟踪已应用在智能监控、智能交通、人机交互、安保机器人中。单目标跟踪是在视频初始帧给定跟踪目标的位置和大小,然后在接下来的视频帧中对目标进行跟踪。本文跟踪的目标是人,而人属于非刚体,相对于刚体(汽车、自行车)容易发生形变。由于形变的方向和大小是无法预测的,很难使用几何形状来描述人的形变。多人场景比单人场景要复杂些,多人场景下人与人容易发生遮挡,这会使得跟踪的鲁棒性有所下降。针对以上问题,本文对现有的目标跟踪算法进行了深入的研究,主要工作如下:(1)针对背景干扰和目标人会发生形变的问题,提出一种基于注意力机制与多层深度特征融合的目标人跟踪模型(Multi-Layer Depth Feature and ChannelSpace Attention,MLDF-CSA)。该模型首先将卷积的高层语义特征和低层视觉特征进行加权融合,然后经过通道-空间注意力模块,给目标特征赋予较高的权重,背景特征赋予较低的权重。使用logistic与中心损失函数组成的多损失函数训练模型。实验结果表明,本文提出的MLDF-CSA与其他主流的跟踪算法相比,其目标跟踪的成功率和精确度都有较明显的提高,...

【文章页数】:75 页

【学位级别】:硕士

【部分图文】:

图1-1目标跟踪应用领域

图1-1目标跟踪应用领域

武汉理工大学硕士学位论文2交通拥挤、提高道路行驶的安全性、方便居民出行。其中,对道路上车辆和行人的跟踪与监控获取的基础信息在智能系统中起着至关重要的作用,因为获取的基础信息有助于智能交通系统控制与决策。因为传统交通系统的很多工作都是由人工来完成的,采用自动化的方式将会减少大量的人....


图2-1视频序列

图2-1视频序列

督学习到的跟踪目标类间的特征是可区分的,但是由于人会发生形变等原因导致人的特征会发生显著的变化,可能会导致目标类内的距离大于类间的距离。Wen等人[25]发现有的样本的类内距离大于类间距离。为了减少类内的距离,Wen等人提出了中心损失函数,并将其与深度卷积网络相结合用在人脸识别中....


图2-2女孩图像(左)与人类在观察时的注意力分布(右)

图2-2女孩图像(左)与人类在观察时的注意力分布(右)

武汉理工大学硕士学位论文13SiamFC网络中的高层和低层的卷积特征进行融合,然后将融合的特征通过通道-空间注意力模块,给目标的特征赋予较高的权重,背景特征赋予较低的权重。同时使用中心损失函数与logistic损失函数组合的多损失函数来离线训练网络,提高跟踪器的判别性。2.2注意....


图2-3序列注意力机制图

图2-3序列注意力机制图

武汉理工大学硕士学位论文14位置。比如从输入的特征中裁剪一块指定的区域,然后将该区域作为注意力作用的最后结果。硬注意力的不足之处在于其采用离散的位置来选择信息,导致注意力函数作用的在网络中是不可导的,这就使得硬注意力无法在神经网络中进行端到端的训练。注意力机制可以理解为从大量信息....



本文编号:3963772

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3963772.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户171f0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]