# -*- coding: utf-8 -*-

from sklearn.neighbors import KNeighborsClassifier
from sklearn.naive_bayes import GaussianNB
from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.neural_network import MLPClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report
from sklearn.datasets import load_iris
import argparse

2.数据载入

先设置参数

# 设置参数
ap = argparse.ArgumentParser()
ap.add_argument("-m", "--model", type=str, default="knn", help="type of python machine learning model to use")
args = vars(ap.parse_args())

# 定义一个保存模型的字典，根据 key 来选择加载哪个模型
models = {
    "knn": KNeighborsClassifier(n_neighbors=1),
    "naive_bayes": GaussianNB(),
    "logit": LogisticRegression(solver="lbfgs", multi_class="auto"),
    "svm": SVC(kernel="rbf", gamma="auto"),
    "decision_tree": DecisionTreeClassifier(),
    "random_forest": RandomForestClassifier(n_estimators=100),
    "mlp": MLPClassifier()
}

然后载入数据

print("[INFO] loading data...")
dataset = load_iris()
(trainX, testX, trainY, testY) = train_test_split(dataset.data,
    dataset.target, random_state=3, test_size=0.25)

这行代码我需要解释一下

dataset直接用的load，库里面自带的

然后用split来划分

75% 数据作为训练集，25% 作为测试集。

3.训练模型

# 训练模型
print("[INFO] using '{}' model".format(args["model"]))
model = models[args["model"]]
model.fit(trainX, trainY)

4.预测

# 预测并输出一份分类结果报告
print("[INFO] evaluating")
predictions = model.predict(testX)
print(classification_report(testY, predictions, target_names=dataset.target_names))

5.结果

我们可以看到，用KNN预测的准确率高达 0.95 也就是95%

我哭了泥萌呢？

GIT源码地址：

https://github.com/PANBOHE/Beginner-s-Machine-Learning-Introduction-

Iris(鸢尾花) 数据集-机器学习入门

一环境

二基础知识

三任务

1.导入需要的库

2.数据载入

3.训练模型

4.预测

5.结果

GIT源码地址：

猜你喜欢

Iris(鸢尾花) 数据集-机器学习入门

一 环境

二 基础知识

三 任务

1.导入需要的库

2.数据载入

3.训练模型

4.预测

5.结果

GIT源码地址：

猜你喜欢

一环境

二基础知识

三任务