当前位置:主页 > 科技论文 > 测绘论文 >

基于随机森林算法的城市不透水面信息提

发布时间:2024-04-22 18:48
  为了快速、准确地掌握不透水面的空间分布及满足动态变化信息现实需求,本文基于多分类器集成学习的思想,引入随机森林算法,以Landsat8影像为数据源,长春市为实验区,选取光谱特征、纹理测度、空间变换后的独立分量等25个特征变量进行分类研究,根据OOB误差进行重要性分析并试验得出最优的分类模型,实现高精度不透水面信息的提取,最后与传统参数分类法进行比较。结果表明:随机森林算法的总体精度可以达到94%,高出最大似然分类法5.9%,支持向量机算法0.77%,Kappa系数为0.914 3,均方根误差为0.104 3,不透水面的提取精度达95.54%,可以精确地得出所需信息,为城市建设与规划提供有效的专题数据。

【文章页数】:7 页

【部分图文】:

图1研究区

图1研究区

首先利用ENVI5.1中的RadiometricCalibration工具进行辐射定标,将像元DN值转为反射率;然后利用FlaashAtmosphericCorrection模块进行大气校正,消除大气对传播过程的影响;最后将校正后的影像进行拼接并按研究区范围进行剪裁,定义....


图2MNF变换

图2MNF变换

本文利用ENVI5.1中的ForwardMNFEstimateNoiseStatistics工具对影像进行MNF变换并选择前3个分量加入分类特征,变换后的图像如图2所示。2.3RF算法


图3随机森林原理

图3随机森林原理

为了平衡时间效率以及获取最优的分类结果,参数优选是一个必不可少的过程。随机森林算法的分类精度主要受到两个参数的调控:每个节点随机选取的特征数目和模型中决策树的个数,因此将从两部分讨论分类精度随两个参数的变化情况。3.1.1特征数目的影响


图4分类精度随特征数的变化情况

图4分类精度随特征数的变化情况

当森林规模过小时,模型不稳定,具有较大的随机性,而森林规模过大时,模型冗余,计算繁杂。因此,根据经验首先设置树的个数为100,特征数目从1~15逐一变化进行模型训练,并将训练样本的1/3数据作为测试集,评估不同参数下随机森林在训练集和测试集下的表现,得到的结果如图4所示。图4中实....



本文编号:3962118

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/dizhicehuilunwen/3962118.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户8f7d4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]