基于彩色-深度图像信息的室内场景语义分割研究

发布时间：2024-04-13 19:32

　　图像语义分割一直是计算机视觉领域的研究热点,其目的是通过分割不同物体,赋予物体不同语义类别标签,使计算机全面地获取场景语义信息。但目前研究主要聚焦在使用彩色图像数据作为训练,针对室外场景且单一任务的语义分割。而在实际应用中,室内场景比室外更加复杂,机器人除了需要知道物体的语义类别信息之外,还需要知道物体的位置信息以便完成更为复杂的视觉任务,同时室内场景光照等因素会对彩色图像产生影响。针对以上问题,本文以复杂室内场景为研究对象,利用RGB-D图像信息,基于深度学习、卷积神经网络算法为研究基础,开展联合目标检测的多任务语义分割研究,主要研究工作如下:(1)基于Kinect室内场景数据库的建立。通过Kinect的相关内置参数矩阵,确定相机彩色摄像头与深度摄像头的位置关系,保证相机采集的彩色与深度图像一一对应。利用Kinect获得室内场景的彩色图像和深度图像,构建室内场景图像数据库。(2)基于卷积神经网络的RGB图像室内场景语义分割。构建基于改进的FCN语义分割模型,采用迁移学习的思想对模型进行训练,引入深度优化算法,提升网络的训练速度和收敛速度,建立室内场景下基于彩色图像的训练模型,语义分割...

【文章页数】：80 页

【学位级别】：硕士

【部分图文】：

图2.1图像处理的一般流程

伴随着计算机视觉技术的不断发展,也促进了视觉传感器技术的快速发展,使得图像的获取变得越来越容易,获取图像的分辨率也越来越高,图像中含有的特征信息也越来越多,图像工程技术因此而产生。图像工程根据其抽象程度以及研究方法的不同主要分为图像处理、图像分析和图像理解等三个层次。其中,图像处....

图2.2立体视觉法原理示意图

立体视觉法是基于计算机视觉最基本的相机模型,主要是通过不同位置的相机对同一目标拍摄的两幅和多幅图像组成立体像对,在实现标定好相机内外参数的前提下,根据三角测量原理,利用对应点的视觉来计算相机视野范围内的立体信息,其原理如图2.2所示。立体视觉法通过模拟人类双眼处理景物的方式,能一....

图2.3结构光原理示意图

结构光的方法主要是一种采用可控光源的技术,充分利用光源中的空间几何信息,有效地提取场景中物体的几何信息。它首先利用相机在拍摄过程中检测光源照射在物体表面产生光条纹的形态和间断性,然后以此来表现物体表面的形状信息,最后经过装置标定方可计算出被光照射点的三维坐标信息,其原理如图2.3....

图2.4常见的彩色深度相机

基于彩色深度图像信息研究的需要,助推了图像采集智能设备的发展。目前市面上比较主流的RGB-D深度相机有微软公司的Kinect系列、华硕的Xtion系列、奥比中光以及Intel公司的RealSense等,如图2.4所示。Kinect是微软公司于2010年推出的一款RGB-D相机,主....

本文编号：3953515

资料下载

论文发表

支付宝下载
微信下载
会员下载

本文链接：https://www.wllwen.com/kejilunwen/shengwushengchang/3953515.html

上一篇：基于U-net神经网络的混凝土路面图像裂缝识别算法研究
下一篇：基于LWT-SWT和加权变换的蒙古族家具纹样增强与识别研究