基于多尺度特征融合与上下文分析的目标检测技术研究

发布时间:2023-11-11 14:38
  目标检测技术即在给定的图像或者视频中对实例目标进行识别并定位,是计算机视觉领域的重要课题之一,推动了智能监控、人脸识别以及图像分割等领域的发展。目前,基于深度学习的目标检测模型具有小尺度目标检测精度较低和目标重叠遮挡等复杂环境下适应能力弱两个典型问题。因此,该文主要研究目的是分析问题的原因并提出几种高效的目标检测模型,能够有效解决这两个问题,最终提高模型的检测精度。首先,针对小尺度目标检测精度较低的问题,该文提出了一种基于多尺度特征融合的目标检测模型MS-Faster R-CNN,基于Faster R-CNN的基本架构,采取了优化的多尺度特征融合策略,结合FPN金字塔特征提取方法的同时使用了两条链路完成特征融合,使得融合特征的语义更为丰富,能够适应不同尺度目标使用。在候选框推荐阶段使用了级联RPN和优化的NMS方法,使得小尺度目标的候选框不会被过度抑制,提高候选框的推荐效率。最后,采用基于双线性插值法的ROI Align池化技术,避免量化造成精度损失。然后,针对复杂环境下适应能力弱的问题,该文提出一种基于上下文分析的目标检测模型LSTM-Faster R-CNN,采取基于LSTM的全局...

【文章页数】:89 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
专用术语注释表
第一章 绪论
    1.1 课题背景与意义
    1.2 主要工作和文章结构安排
第二章 相关技术研究
    2.1 相关基础知识
        2.1.1 卷积神经网络相关内容
        2.1.2 目标检测技术关键组成
    2.2 基于深度学习的目标检测模型
        2.2.1 基于候选区域的目标检测模型
        2.2.2 基于回归方法的目标检测模型
    2.3 多尺度特征融合与上下文分析
        2.3.1 基于多尺度特征融合的目标检测模型
        2.3.2 基于上下文分析优化的目标检测模型
    2.4 本章小结
第三章 一种多尺度特征融合的目标检测模型
    3.1 问题分析
    3.2 MS-Faster R-CNN模型详述
        3.2.1 总体结构
        3.2.2 多尺度特征融合策略
        3.2.3 优化的RPN候选框推荐模块
        3.2.4 ROI Align池化技术
    3.3 MS-Faster R-CNN训练策略与实现细节
        3.3.1 整体模型的训练策略和实现细节
        3.3.2 各模块的训练策略和实现细节
    3.4 实验结果与分析
        3.4.1 实验准备与衡量标准
        3.4.2 结果分析与对比
        3.4.3 消去实验
    3.5 本章小结
第四章 一种基于上下文分析的目标检测模型
    4.1 问题分析
    4.2 LSTM-Faster R-CNN模型详述
        4.2.1 总体结构
        4.2.2 主干网络特征提取
        4.2.3 基于LSTM全局上下文信息提取子网络
        4.2.4 融合目标关系组件的全连接层
    4.3 LSTM-Faster R-CNN训练策略与实现细节
        4.3.1 整体模型的训练策略和实现细节
        4.3.2 各模块的训练策略和实现细节
    4.4 实验结果与分析
        4.4.1 实验准备与衡量标准
        4.4.2 结果分析与对比
        4.4.3 消去实验
    4.5 本章小结
第五章 目标检测系统设计与实现
    5.1 系统总体架构
    5.2 系统功能设计
    5.3 系统环境和界面展示
        5.3.1 软、硬件环境
        5.3.2 系统界面展示
    5.4 本章小结
第六章 总结与展望
参考文献
附录1 攻读硕士学位期间撰写的论文
附录2 攻读硕士学位期间申请的专利
附录3 攻读硕士学位期间参加的科研项目
致谢



本文编号:3862738

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3862738.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户58dd4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]