基于深度学习的车载视频中行人检测技术研究

发布时间：2024-03-16 06:34

　　车载视频中的行人检测技术是无人驾驶的重要组成部分,在检测精度和速度方面都有着较高的要求。由于行人在视频或者图像中的尺度问题以及复杂的背景环境问题,使得检测器的性能会受到很大的影响。本文在现有SSD算法的基础进行改进,以提高检测系统的性能。主要的研究工作包括:一、在 SSD 算法的基础上构建 AMSSD(Advanced MobileNet SSD,AMSSD)行人检测网络模型。首先在SSD算法中使用MobileNet网络减少计算量,从而提高检测的速度;然后再抽取合适的网络层构成分支检测网络,并针对行人尺度多变的情况,融合不同网络层的特征图进行检测。本文使用VOC和COCO数据集作为训练集,对Cityscapes数据集进行测试,实验结果表明AMSSD算法能够在保持精度的前提下提高检测速度,可达到实时的效果。二、在AMSSD行人检测网络模型的基础上添加Focal Loss损失函数,构建FAMSSD(Focal Loss and Advanced MobileNet SSD,FAMSSD)行人检测网络模型。该模型可平衡算法中正负样本和简单困难样本的数量,以得到更好的行人检测性能。实验结果表明...

【文章页数】：67 页

【学位级别】：硕士

【部分图文】：

图２．?１?ＳＳＤ默认框??

适??用于尺度较大的目标的检测，例如狗。而８Ｘ８的特征图更适合于尺度较小的目标的检??测，例如猫。这些ｄｅｆａｕｌｔ?ｂｏｘ主要用于确定目标的位置和类别，在训练中真实框会与??ｄｅｆａｕｌｔ?ｂｏｘ相匹配，当ｄｅｆａｕｌｔ?ｂｏｘ与真实框能够匹配上，则为正样本，否则就是负样本，?....

图２．?２?ＳＳＤ网络??Ｆｉｇ．?２．２?ＳＳＤ?ｎｅｔｗｏｒｋ??

?大连海事大学专业学位硕士学位论文???（１；〇１１￥４－３、￡〇１１￥１０－２、（＾〇１１￥１１－２米用的是每个单兀生成４个（＾￡＆１１１１；１）〇＼，而（１；〇１１￥７、（２〇１１＼／８－??２、Ｃｏｎｖ９－２则是釆用每个单元生成６个ｄｅｆａｕｌｔ?ｂｏｘ，根据上面的预测值计....

图２．?３检测网络层处理过程??Ｆｉｇ．?２．３?Ｄｅｔｅｃｔｉｏｎ?ｏｆ?ｎｅｔｗｏｒｋ?ｌａｙｅｒ?ｐｒｏｃｅｓｓ??

ｍｂ〇ｘ＿ｌ〇ｃ?Ｃｏｎｖ４＿３＿ｍ?ｂｏｘ＿ｃｏｎｆ?Ｃｏｎｖ４＿３＿ｍｂｏｘ＿ｐｒｉｏｒｂｏｘ??ｉ?Ｃｏｎｖ４＿３＿ｍｂｏｘＪｏｃ＿ｐｅｒｍ?丨?ｉ?Ｃｏｎｖ４？３．．．ｍｂｏｘ．．．．ｃｏｎｆ＿ｐｅｒｍ?姜??ｆ?Ｃｏｎｖ４＿３＿ｍｂｏｘ＿ｌｏｃ＿ｆｌａｔ?；?Ｉ?Ｃｏｎ....

图２．４普通卷积过程和ＭｏｂｉｌｅＮｅｔ卷积过程??

在卷积后面就??是一系列的深度卷积和点卷积过程，而且会对部分深度卷积过程采取步长为２的下采样??操作。然后ａｖｇ?ｐｏｏｌ将特征图变为１?Ｘ?１大小，在全连接层后就是ｓｏｆｔｍａｘ分类器。??普通卷积过程和ＭｏｂｉｌｅＮｅｔ卷积过程对比图如２．４所示：??Ｉ?３ｘ３?Ｃｏｎｖ?｜....

本文编号：3929259

资料下载

论文发表

支付宝下载
微信下载
会员下载

本文链接：https://www.wllwen.com/kejilunwen/shengwushengchang/3929259.html