网贷祸害了多少家庭?风险多大?通过Python数据分析识别网贷风险

本文基于决策树算法设计和构建一个简洁的信贷审批模型,实现自动化和智能化量化和识别风险。前一段时间,是经常刷到某某机构贷款多少,某某学生因为违约金而跳楼自杀?学生由于经济压力还不起,网贷公司就越来越催着还款,其实国家是有法律的,只要利息或者违约金不超过多少,是不需要偿还这么多的资金的,小编也偷偷的查过一些网贷公司,确实很坑,我碰到过那种借三百还四百的,前提条件是没有逾期,这个霸王条约是真的恐怖,所以小编也在这里劝大家,最好不要去接触这个网贷,学生的话,没钱可以和家里沟通,和同学沟通,没必要非得深陷进去,进去了就很难拔出来了,还有很多的女大学生搞什么裸贷,女生还是以自己的名誉为主,虚荣心虽然很难满足,但是可以通过自己的双手来让自己的生活过的更好,好了咱们废话不多说,来到咱们的主题!

网贷祸害了多少家庭?风险多大?通过Python数据分析识别网贷风险

 

网贷祸害了多少家庭?风险多大?通过Python数据分析识别网贷风险

 

网贷祸害了多少家庭?风险多大?通过Python数据分析识别网贷风险

 

结论:

私信小编007即可获取数十套PDF,如果需要源码请给小编留言!

网贷祸害了多少家庭?风险多大?通过Python数据分析识别网贷风险

 

  • 1 数据集拥有1000个样本和17个特征
  • 2 特征集是数值型和因子型的组合
  • 3 特征集源自信贷或者信贷人
网贷祸害了多少家庭?风险多大?通过Python数据分析识别网贷风险

 

  • 贷款期限跨越4个月到72个月,中位数是18个月
  • 贷款金额从250DM到18424DM,中位数是2320DM

5 目标变量分布

table(credit$default)

网贷祸害了多少家庭?风险多大?通过Python数据分析识别网贷风险

 

** 结论**:

  • 30%的违约率

第三步:数据准备

1 数据集划分

数据集划分为训练集和测试集。

网贷祸害了多少家庭?风险多大?通过Python数据分析识别网贷风险

 

网贷祸害了多少家庭?风险多大?通过Python数据分析识别网贷风险

 

或者 利用caret包的createDataPartition()函数,进行分层抽样,90%为训练集,10%为测试集。

网贷祸害了多少家庭?风险多大?通过Python数据分析识别网贷风险

 

第四步:建立模型

使用C50包里面的C5.0决策树算法。

网贷祸害了多少家庭?风险多大?通过Python数据分析识别网贷风险

 

** 结论**:

决策树规则集前三行(见红色方框)的规则策略:

  • 如果checking account balance 是大于 200DM或者 Unknown,则可能不违约
  • 如果checking account balance 是小于 0DM 或者 在1-200DM之间,并且credit history 是perfect 或者very good,则可能违约

summary(C50_model)会显示混淆矩阵,还会指明训练模型的错误率,如下图所示:

网贷祸害了多少家庭?风险多大?通过Python数据分析识别网贷风险

 

** 结论**:

  • 训练模型的错误率:14.8%

决策树算法通常存有过拟合问题。因此,需要对模型做优化处理,然后在测试数据集上面评估模型性能。

第五步:评估模型

测试数据集评估模型性能。

网贷祸害了多少家庭?风险多大?通过Python数据分析识别网贷风险

 

网贷祸害了多少家庭?风险多大?通过Python数据分析识别网贷风险

 

** 结论** :

  • 测试数据集100个样本,错误率是27%。测试数据集上面模型表现的性能比训练数据集上要差
  • 测试集上面对于违约情况的召回率是42%,这类错误是严重的错误,会导致银行损失

解决方案:

模型性能调优

第六步:优化模型性能

1 超参数调优

C5.0算法通过自适应提升改进C4.5算法。在C5.0函数里面,通过超参数trials设置。

网贷祸害了多少家庭?风险多大?通过Python数据分析识别网贷风险

 

网贷祸害了多少家庭?风险多大?通过Python数据分析识别网贷风险

 

** 结论**:

  • 测试数据集的错误率是18%,相对于前面模型,改善了9%的错误率
  • 测试集上面对于违约情况的召回率是61%,相对于前面的模型,提升了19%的命中率

2 错误类型的代价分析

对不同类型的错误,赋予不同的代价值

  • 设计错误代价矩阵
网贷祸害了多少家庭?风险多大?通过Python数据分析识别网贷风险

 

网贷祸害了多少家庭?风险多大?通过Python数据分析识别网贷风险

 

** 结论**:

  • 测试集上面对于违约情况的召回率是79%

所以大家还是远离一些非法机构的网贷,要找肯定也要找上市公司有保障的,这样的公司是不会有非法的暴利收取手续费的,劝勉大家最好是远离网贷,谢谢大家阅读!

 

猜你喜欢

转载自www.cnblogs.com/python246359/p/9361860.html