基于稠密反卷积聚合网络的图像语义分割技术研究

发布时间:2024-02-28 18:36
  语义分割在机器人视觉中起着非常重要的作用,可用于众多现实世界的应用程序中,例如虚拟现实和增强现实,机器人技术和自动驾驶技术。最近,在全卷积网络(FCNs)中的不同层中探索多个特征图以捕获上下文信息已经引起了广泛的关注。本文针对语义分割任务,本文提出了两项工作:(1)针对FCN、U-net网络的不足,本文提出了一种新颖的编码器-解码器结构,称之为稠密反卷积聚合网络(Dense Deconvolution Aggregating Network,DDANet)。此网络通过将编码端深层的卷积特征稠密上采样到解码端来聚合上下文信息。融合在一起的特征图相互补充,使网络能更充分的探索包含在图像中的全局信息。DDANet通过端到端的训练,以匹配输入图像的分辨率。本文在自动驾驶数据集City Scapes上评估了提出的DDANet,实验结果显示,DDANet的方法优于之前提出的全卷积网络(FCNs)和编码器-解码器网络(EDNs)。在其他的数据集上,DDANet也取得了优异的成绩,例如PASCAL VOC 2012数据集和ISBI 2012数据集,分别是针对室内/室外场景解析和医学细胞分割的挑战。(2...

【文章页数】:62 页

【学位级别】:硕士

【部分图文】:

图1.1图像语义分割说明图

图1.1图像语义分割说明图

南京邮电大学专业学位硕士研究生学位论文第一章绪论1第一章绪论研究背景与意义人工智能吸引了全世界顶尖、最有影响力的技术公司,例如Google、Facebook等,它被公认为第四次工业革命。人工智能覆盖领域众多,落地应用的垂直领域也会随着算法的不断优化完善越来越多,例如神经网络在图像....


图2.1卷积操作示意图

图2.1卷积操作示意图

南京邮电大学专业学位硕士研究生学位论文第二章相关背景知识介绍6第二章相关背景知识介绍卷积神经网络术语介绍近几年深度学习非常火爆,越来越多的学者投身到这个领域的研究中。深度学习是机器学习的一个分支,卷积神经网络(ConvolutionalNeuralNetwork,CNN)是深度学....


图2.2最大池化操作示意图

图2.2最大池化操作示意图

南京邮电大学专业学位硕士研究生学位论文第二章相关背景知识介绍8池化操作。在每一个2×2的区域中选出最大值留下,其他的值舍弃。留下的值保持原来的相对位置不变,形成池化后的特征图。卷积核为2×2,步长为2是最大池化最为常见的参数,操作后得到的特征图的分辨率是输入图像分辨率的一半。池化....


图2.3残差块结构示意图

图2.3残差块结构示意图

南京邮电大学专业学位硕士研究生学位论文第二章相关背景知识介绍11达到饱和。如果再继续增加网络的深度,网络的准确率反而会下降。不仅在测试集上的误差值增大,在训练集上的误差同样也增大了,因此这不是过拟合问题。假设一个浅层的网络的准确率已经达到了饱和状态,那么在网络的后面再加上几层全等....



本文编号:3913862

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3913862.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户7bb8c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]