最近学习到深度学习的卷积神经网络那里,感觉有点吃力了,所以先来一些比较轻松愉快的,先写写代码,获得一些继续学习的动力。
sklearn 的通用的学习模式
简介
这篇文章仅仅只是一个笔记,感受一下使用 scikit-learn 这个框架的基本步骤。
1、使用 scikit-learn 为我们提供的数据库,这样我们自己就不用手动输入数据啦;
iris = datasets.load_iris()
iris_X = iris.data
iris_y = iris.target
2、将给出的数据分为训练集和测试集;
X_train, X_test, y_train, y_test = train_test_split(iris_X, iris_y, test_size=0.3)
3、训练数据
knn = KNeighborsClassifier()
knn.fit(X_train, y_train)
4、预测数据
print(knn.predict(X_test))
安装 scikit-learn:
pip3 install -U scikit-learn
“-U” 表示更新操作。
代码实现
import numpy as np
from sklearn import datasets
from sklearn.cross_validation import train_test_split
from sklearn.neighbors import KNeighborsClassifier
iris = datasets.load_iris()
iris_X = iris.data
iris_y = iris.target
print(iris_X[:2, :])
# 标签的数据是整齐划一的
print(iris_y)
X_train, X_test, y_train, y_test = train_test_split(iris_X, iris_y, test_size=0.3)
# train_test_split 这个方法把标签数据打乱
# 在机器学习中认为无序的数据要比有序的数据的学习效果好
print(y_train)
## 训练开始
knn = KNeighborsClassifier()
# 就这一句话,帮你训练完成
knn.fit(X_train, y_train)
# 训练结束
# 把测试数据放进去
print("--- 机器学习的 sklearn 帮我们训练出来的结果 ---")
print(knn.predict(X_test))
print("--- sklearn 的真实数据结果 ---")
print(y_test)