在上一篇文章「07」回归的诱惑:深入浅出逻辑回归 里,我们详细解释了什么是分类算法以及逻辑回归、逻辑回归的特点,这一期给出实战案例的Python代码,供大家参考
第一步 导入数据
from collections import OrderedDict
import pandas as pd
#数据集
examDict={
'学习时间':[0.50,0.75,1.00,1.25,1.50,1.75,1.75,2.00,2.25,
2.50,2.75,3.00,3.25,3.50,4.00,4.25,4.50,4.75,5.00,5.50],
'通过考试':[0,0,0,0,0,0,1,0,1,0,1,0,1,0,1,1,1,1,1,1]
}
#将数据导入到DataFrame中
examOrderDict=OrderedDict(examDict)
examDf=pd.DataFrame(examOrderDict)
第二步 提取特征和标签
#提取特征和标签
#特征features
exam_X=examDf.loc[:,'学习时间']
#标签labes
exam_y=examDf.loc[:,'分数']
下图为学生数据的分布情况: