当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于决策树的空气质量建模

发布时间:2024-04-25 05:31
  为了更方便直观的预测空气质量,利用决策树算法建模。以天水市近三年空气质量数据为研究对象,借助scikit-learn平台对数据进行建模。采用交叉验证和网格搜索的调参手段,使剪枝效果达到最佳。结果表明,模型在测试数据上准确率可以达到94%,说明模型具有一定的预测价值。

【文章页数】:3 页

【部分图文】:

图1系统总体设计

图1系统总体设计

对缺省数据进行处理等。1.3CART算法使用基尼指数准则用于决策树划分选择。决策树算法是一种预测模型,描述了对象属性与对象值之间的一种映射关系,是上个世纪60年代到70年代提出的一种用于数据分类的算法。自提出以来,就一直不断发展,精益求精,从ID3,ID4到CART决策树算法,再....


图2criterion算法学习曲线

图2criterion算法学习曲线

使用相同的方法,得到其他参数的学习曲线。经过超参数学习曲线调整后,大概知道了数据的范围。然后利用网格搜索法搜索最佳的数值,其模型最佳参数组合如表2所示。图3max_depth学习曲线


图3max_depth学习曲线

图3max_depth学习曲线

图2criterion算法学习曲线表2网格搜索后的参数参数criterionmax_depthmin_samples_leafmin_samples_splitmax_features数值entropy4293


图1不调参的效果图

图1不调参的效果图

选取数据集的70%作为训练集,30%用作测试集。在不加限制情况下,一颗决策树可以生长到纯度最优,这样就会出现在训练集上效果很好,但是在测试集上效果很差的状况,把这种现象称为过拟合[2]。首先在不设置任何参数的情况下,查看决策树算法在训练集和测试集上的执行效果,如图1所示。从图中可....



本文编号:3964079

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3964079.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户4e587***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]