#1. 安装scipy,numpy,sklearn包 from sklearn.datasets import load_iris #导入numpy import numpy #2. 从sklearn包自带的数据集中读出鸢尾花数据集data #3.查看data类型,包含哪些数据 data = load_iris() print(type(data)) print(data.keys())
结果:
#4.取出鸢尾花特征和鸢尾花类别数据,查看其形状及数据类型 #鸢尾花特征 iris_feature = data_iris['data'] print(iris_feature) #鸢尾花类型 iris_target = data_iris['target'] print(iris_target)
结果:
# 5.取出所有花的花萼长度(cm)的数据 iris_len=numpy.array(list(len[0] for len in data['data'])) print(iris_len)
结果:
#6.取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据 for len_width in iris_len: print(len_width[2],len_width[3])
结果:
# 7.取出某朵花的四个特征及其类别。 print(data['data'][0],data['target_names'][0])
结果:
# 8.将所有花分成三个组,每组50个 iris_setosa=[] iris_versicolor=[] iris_virginica=[] for i in range(0,150): if data['target'][i]==0: data1=data['data'][i].tolist() data1.append('setosa') iris_setosa.append(data1) elif data['target'][i]==1: data1=data['data'][i].tolist() data1.append('versicolor') iris_versicolor.append(data1) else: data1=data['data'][i].tolist() data1.append('virginica') iris_virginica.append(data1)
#9.生成新的数组,每个元素包含四个特征+类别 datas=numpy.array([iris_setosa,iris_versicolor,iris_virginica]) print(datas)
结果: