基于XGBoost的网络贷款风险预测

发布时间:2023-05-17 20:22
  随着银行和金融机构的贷款业务越来越多,坏账对互联网金融市场的发展带来极大的负面影响。如何制定一个策略对客户是否会违约做预测,并使利润达到最大化,是所有信贷机构最关心的问题。因此,就如何减少不良贷款问题建立一个准确的信用评分卡模型对市场经济的稳定发展有重要意义。在背景介绍和数据准备部分,首先,介绍了信贷风险的概念和P2P信贷的发展背景,并对几种机器学习模型理论和信用评分卡理论做了阐述。其次,针对某互联网金融平台的个人信贷数据集,通过数据探索、数据预处理、特征工程等操作,生成了可用于建模的数据。在模型实证分析部分,首先,建立了基线模型和XGBoost模型,采用评价指标AUC值和KS值研究了模型对逾期客户的判别能力,发现XGBoost模型优于逻辑回归、决策树和随机森林三种基线模型。其次,针对数据的不平衡性质,通过引入代价敏感学习策略,提出了改进版XGBoost模型。相比原XGBoost模型,改进后的XGBoost模型对逾期风险的预测精度得到了一定的提升。最后,针对XGBoost模型,采用Stacking融合技巧,提出了新的XGBoost模型。相比原XGBoost模型,新模型的AUC值和KS值...

【文章页数】:55 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 选题背景和意义
    1.2 国内外研究现状
        1.2.1 国外研究现状
        1.2.2 国内研究现状
    1.3 研究内容
第二章 机器学习模型理论
    2.1 逻辑回归模型
        2.1.1 逻辑回归算法原理
        2.1.2 逻辑回归参数求解
    2.2 决策树与随机森林
        2.2.1 决策树
        2.2.2 分类与回归树
        2.2.3 随机森林
    2.3 XGBoost
        2.3.1 Boosting算法思想
        2.3.2 XGBoost的算法原理
第三章 信用评分卡理论
    3.1 信用评分卡基本概念
    3.2 评分卡建模流程
        3.2.1 问题定义
        3.2.2 样本选取
        3.2.3 特征工程
        3.2.4 评分卡建模
        3.2.5 模型评估
第四章 用户贷款数据处理
    4.1 数据简介
    4.2 描述性统计分析
        4.2.1 性别与违约的关系
        4.2.2 学历与违约的关系
        4.2.3 会员级别与违约的关系
        4.2.4 收入与违约的关系
        4.2.5 信用评分与违约的关系
    4.3 数据预处理
        4.3.1 数据集成
        4.3.2 数据清洗
    4.4 特征工程
    4.5 数据集的划分
第五章 贷款风险预测实证分析
    5.1 模型评价指标
        5.1.1 KS统计量
        5.1.2 ROC曲线和AUC
    5.2 基线模型对贷款逾期预测的结果和效果
        5.2.1 逻辑回归模型
        5.2.2 决策树与随机森林
    5.3 XGBoost模型对贷款逾期预测的结果和效果
        5.3.1 XGBoost及其调优
        5.3.2 基于代价敏感学习的XGBoost
        5.3.3 基于XGBoost的Stacking融合
总结与展望
参考文献
致谢



本文编号:3817939

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3817939.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户6a3de***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]