作者原创,转载请注明原地址
CSV地址:
python目录\lib\site-packages\sklearn\datasets\data
CSV结构:
具有151行*5列的结构,如下图
第一行-包含描述数据:
1,1 - 150:是N,数据点个数
1,2 - 4:是d,特征维数
1,3 -1,5:对应的label, 数据表示的话从0计数
其余部分含义:
视为150*5的矩阵,读取之后转置变成5*150
每行对应实际意义是:
1-4:
'feature_names': [
'sepal length (cm)',
'sepal width (cm)',
'petal length (cm)',
'petal width (cm)'],
- Sepal.Length(花萼长度),单位是cm;
- Sepal.Width(花萼宽度),单位是cm;
- Petal.Length(花瓣长度),单位是cm;
- Petal.Width(花瓣宽度),单位是cm;
5:标签0/1/2 对应三种花名
'target_names': array(['setosa', 'versicolor', 'virginica'], dtype='<U10')
种类:Iris Setosa(山鸢尾)、Iris Versicolour(杂色鸢尾),以及Iris Virginica(维吉尼亚鸢尾)