机器学习-贝叶斯分类器

from sklearn.naive_bayes import GaussianNB
from logistic_regression import plot_classifier
import numpy as np
import matplotlib.pyplot as plt
X = []
y = []
f = open('E:\MachineLearning\CodeBook\data_multivar.txt', 'r')#打开文件
lines = f.readlines()     #一次性按行把所有数据读取出来
for line in lines:       #逐行读取文件
    #print(line)          #打印一行数据
    data = [float(i) for i in line.split(',')]#逗号分隔字段,并将字段转化为浮点数
    xt ,yt = data[:-1], data[-1]
    X.append(xt)
    y.append(yt)
X = np.array(X)
y = np.array(y)

#建立一个朴素贝叶斯分类器
classifier_gaussiannb = GaussianNB()
classifier_gaussiannb.fit(X, y)
y_predict = classifier_gaussiannb.predict(X)
#画图函数画出数据点和边界
def plot_classifier(classifier, X, y):
    # 定义图形的取值范围
    x_min, x_max = min(X[:, 0]) - 1.0, max(X[:, 0]) + 1.0
    y_min, y_max = min(X[:, 1]) - 1.0, max(X[:, 1]) + 1.0

    # 设置网格数据的步长
    step_size = 0.01

    # 定义网格
    x_values, y_values = np.meshgrid(np.arange(x_min, x_max, step_size), np.arange(y_min, y_max, step_size))

    # 计算分类器输出结果
    mesh_output = classifier.predict(np.c_[x_values.ravel(), y_values.ravel()])

    # 数组维度变形
    mesh_output = mesh_output.reshape(x_values.shape)

    # 用彩画画出各个类型的边界
    plt.figure()

    # 选择配方方案
    plt.pcolormesh(x_values, y_values, mesh_output, cmap=plt.cm.gray)

    # 画训练点
    plt.scatter(X[:, 0], X[:, 1], c=y, s=80, edgecolors='black', linewidth=1, cmap=plt.cm.Paired)

    # 设置图形的取值范围
    plt.xlim(x_values.min(), x_values.max())
    plt.ylim(y_values.min(), y_values.max())

   #设置X轴与Y轴
    plt.xticks((np.arange(int(min(X[:, 0])-1), int(max(X[:, 0])+1), 1.0)))
    plt.yticks((np.arange(int(min(X[:, 1])-1), int(max(X[:, 1])+1), 1.0)))

    #坐标含义
    plt.xlabel('X')
    plt.ylabel('Y')
    plt.show()
    return None

plot_classifier(classifier_gaussiannb, X, y)

猜你喜欢

转载自blog.csdn.net/u012967763/article/details/79208615