加载数据
去掉全部是NaN的列
NaN not a number
Na not availabe
NaN 是属于Na的
How=‘all’ 表示 全列都是 Na 的去掉
特征选择和数据清洗
(切片操作,弱备份,相当于视图)
删除load_data变成强备份
将字符型的转换为数值型
findall返回的是数组,在某一列上运用某个函数用apply函数
数据探索
收入存在奇异值
特征和特征的关系
比如贷款量 分期付款的量 相关性 很大 合成一个 提高模型的准确性 和 效率
将NaN清理掉
风险预测建模
数据预测及模型评估
对funded_amnt进行预测
调用贝叶斯模型时报了一个错
现对其进行处理,将loan_statusl列删除