基于深度学习的车载视频中行人检测技术研究

发布时间:2024-03-16 06:34
  车载视频中的行人检测技术是无人驾驶的重要组成部分,在检测精度和速度方面都有着较高的要求。由于行人在视频或者图像中的尺度问题以及复杂的背景环境问题,使得检测器的性能会受到很大的影响。本文在现有SSD算法的基础进行改进,以提高检测系统的性能。主要的研究工作包括:一、在 SSD 算法的基础上构建 AMSSD(Advanced MobileNet SSD,AMSSD)行人检测网络模型。首先在SSD算法中使用MobileNet网络减少计算量,从而提高检测的速度;然后再抽取合适的网络层构成分支检测网络,并针对行人尺度多变的情况,融合不同网络层的特征图进行检测。本文使用VOC和COCO数据集作为训练集,对Cityscapes数据集进行测试,实验结果表明AMSSD算法能够在保持精度的前提下提高检测速度,可达到实时的效果。二、在AMSSD行人检测网络模型的基础上添加Focal Loss损失函数,构建FAMSSD(Focal Loss and Advanced MobileNet SSD,FAMSSD)行人检测网络模型。该模型可平衡算法中正负样本和简单困难样本的数量,以得到更好的行人检测性能。实验结果表明...

【文章页数】:67 页

【学位级别】:硕士

【部分图文】:

图2.?1?SSD默认框??

图2.?1?SSD默认框??

适??用于尺度较大的目标的检测,例如狗。而8X8的特征图更适合于尺度较小的目标的检??测,例如猫。这些default?box主要用于确定目标的位置和类别,在训练中真实框会与??default?box相匹配,当default?box与真实框能够匹配上,则为正样本,否则就是负样本,?....


图2.?2?SSD网络??Fig.?2.2?SSD?network??

图2.?2?SSD网络??Fig.?2.2?SSD?network??

?大连海事大学专业学位硕士学位论文???(1;〇11¥4-3、£〇11¥10-2、(^〇11¥11-2米用的是每个单兀生成4个(^£&1111;1)〇\,而(1;〇11¥7、(2〇11\/8-??2、Conv9-2则是釆用每个单元生成6个default?box,根据上面的预测值计....


图2.?3检测网络层处理过程??Fig.?2.3?Detection?of?network?layer?process??

图2.?3检测网络层处理过程??Fig.?2.3?Detection?of?network?layer?process??

mb〇x_l〇c?Conv4_3_m?box_conf?Conv4_3_mbox_priorbox??i?Conv4_3_mboxJoc_perm?丨?i?Conv4?3...mbox....conf_perm?姜??f?Conv4_3_mbox_loc_flat?;?I?Con....


图2.4普通卷积过程和MobileNet卷积过程??

图2.4普通卷积过程和MobileNet卷积过程??

在卷积后面就??是一系列的深度卷积和点卷积过程,而且会对部分深度卷积过程采取步长为2的下采样??操作。然后avg?pool将特征图变为1?X?1大小,在全连接层后就是softmax分类器。??普通卷积过程和MobileNet卷积过程对比图如2.4所示:??I?3x3?Conv?|....



本文编号:3929259

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3929259.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户6111b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]