3)计算恩格尔系数
对于上一节中的得到的汇总数据,我们首先需要计算学生的总消费金额,具体如下:
#使用sum()方法
#指定axis=1,表示对每一行的数据进行加总,默认为0
#将计算的结果赋值到‘总计’列
card_group['总计']=card_group.sum(axis=1,skipna=False)
得到了汇总结果,接下来就好处理了,仅需要用食堂消费除以总消费即可得到每一个人的恩格尔系数:
card_group['恩格尔1']=card_group['食堂']/card_group['总计']
我们来看一下结果:
print card_group[['食堂','总计','恩格尔1']]
输出如下:
how 食堂 总计 恩格尔1
id
0 647.81 2431.56 0.266417
1 1540.60 2937.69 0.524426
8 387.15 5522.37 0.070106
9 1899.60 7402.91 0.256602
10 944.84 2907.44 0.324973
11 333.40 2670.80 0.124832
19 513.31 1513.06 0.339253
扫描二维码关注公众号,回复:
1376295 查看本文章
最后我们使用to_csv方法将数据写入到csv文件中即可。
card_group.to_csv('card_train.csv',encoding='gbk')
至此,我们计算恩格尔系数的目标大功告成!很激动有木有!