基于深层卷积神经网络的单目图像深度估计

发布时间:2024-02-24 19:40
  图像深度估计作为计算机理解场景三维几何关系的重要环节,是计算机视觉领域研究的热点问题。单目图像深度估计实际上是一个病态问题,因此过去研究人员对其关注度较低。但随着深度学习的发展,单目图像深度估计也逐渐成为热点研究问题。本文以现有研究为基础,提出了一种基于深层卷积神经网络(DCNN)的单目图像深度估计方法,在网络模型、模型训练方法和损失函数三个方面对以往方法进行改进,有效地提高了单目图像深度估计的精度。首先,本文根据图像深度估计是一种密集型预测任务的特点,设计了一种由编码器、多尺度特征提取器和解码器三部分构成的DCNN模型。其中编码器利用卷积和下采样抽取图像中的抽象特征;多尺度特征提取器通过不同膨胀率的空洞卷积来进一步提取编码器输出特征图的多尺度特征;解码器使用反卷积对多尺度特征提取器的输出进行上采样,使得最终输出深度图与输入图像具有相同的分辨率。与典型的编码器-解码器模型相比,本文使用多尺度特征提取器来代替部分下采样和上采样操作,因此能够保留更多的细节信息,并减少网络参数量,从而提高网络的预测精度和算法效率。其次,本文考虑到室外场景深度图获取难度大的特点,采用一种半监督的学习方法对上述...

【文章页数】:72 页

【学位级别】:硕士

【部分图文】:

图2.5常见的激活函数(2)Tanh激活函数

图2.5常见的激活函数(2)Tanh激活函数

图2.5常见的激活函数anh激活函数h函数也称为双曲正切函数,可以看作Sigmoid的一种变体,公式如Sigmod不同的是,Tanh函数将数据压缩到-1~1的范围,解决了S。因此使用Tanh函数作为激活函数的网络在训练中收敛速度要比Tanh函数由于....


图3.1捕获多尺度上下文的体系结构

图3.1捕获多尺度上下文的体系结构

对于图像深度估计、语义分割这类密集型预测任务,在使用深层卷积神经网络时面临了两个挑战。第一个挑战是连续的池化操作或步幅大于1的卷积操作会使特征的空间分辨率降低,虽然这能够使网络学习到越来越抽象的特征,但是这对于依赖于空间信息的密集型预测任务来说有很大的负面作用,因为大量的细节....


图4.2双目相机成像对比

图4.2双目相机成像对比

图4.2双目相机成像对比双目立体视觉实际上就是探索场景深度与左右视图间的视差图之间的几何立体视觉原理就是利用三角测量法来测量距离。三角测量法是一个非常古老测距方法。在技术不发达的时代,由于设备和技术有限,人们便是利用这种量一些难以达到或者不可能达到的目标点,如测量星体距离、....


图4.4双线性插值示意图

图4.4双线性插值示意图

图4.4双线性插值示意图到的()1fR和()2fR,在Y方向上进行线4-6)所示:()()()21122121yyyyfPfRfRyyyy和(4-5)可以得到:()()()()()....



本文编号:3909522

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3909522.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户1c9be***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]