机器学习分类思想

分类思想:

机器分类就是通过分析数据,找出属于不同类别的特征值的规律(或者范围),然后检测需要评判的值更接近于那个类别(只是更接近于,在数据上的体现就是代表评判对象特征值的一组向量与类别(向量组)之间的最小距离),选取最优解。

分类和线性回归类似,都只能预测而不能十分的断定,通俗的将也是存在一定的概率问题。

这里是一个简单的实例,就是通过分析鸢尾花的三个亚种的花萼和花瓣的特征值,形成三个亚种特征值的群组,这是对大量数据训练的结果,然后给出一个新的对象(一组新的特征值向量),对其进行预测,确定(概率性确定)其属于哪一个亚种。

from sklearn.model_selection import train_test_split
from sklearn.feature_extraction import DictVectorizer
from sklearn.tree import DecisionTreeClassifier

def knn_sklearn():

    li=load_iris()

    x_train,x_test,y_train,y_test=train_test_split(li.data,li.target)

    knn=KNeighborsClassifier(n_neighbors=5)

    knn.fit(x_train,y_train)
    
    print(knn.predict(np.array([[6.3,3,5.2,2.3]])))
knn_sklearn()

猜你喜欢

转载自blog.csdn.net/weixin_42575020/article/details/82874305