Sklearn-iris数据集的csv储存结构详解-data model

作者原创,转载请注明原地址

CSV地址:

python目录\lib\site-packages\sklearn\datasets\data

CSV结构:

具有151行*5列的结构,如下图

 

第一行-包含描述数据:

1,1 - 150:是N,数据点个数

1,2 - 4:是d,特征维数

1,3 -1,5:对应的label, 数据表示的话从0计数

其余部分含义:

视为150*5的矩阵,读取之后转置变成5*150

每行对应实际意义是:

1-4:

'feature_names': [

  'sepal length (cm)',
  'sepal width (cm)',
  'petal length (cm)',
  'petal width (cm)'],

  •  Sepal.Length(花萼长度),单位是cm;
  •  Sepal.Width(花萼宽度),单位是cm;
  •  Petal.Length(花瓣长度),单位是cm;
  •  Petal.Width(花瓣宽度),单位是cm;

5:标签0/1/2 对应三种花名

'target_names': array(['setosa', 'versicolor', 'virginica'], dtype='<U10')

种类:Iris Setosa(山鸢尾)、Iris Versicolour(杂色鸢尾),以及Iris Virginica(维吉尼亚鸢尾)

猜你喜欢

转载自blog.csdn.net/qq_38604355/article/details/111503961