【机器学习】Logistic 回归（pytorch）实现

有关逻辑回归的知识点之前讲过，想要再巩固和学习一下的小伙伴可以看这一篇：

【机器学习】逻辑回归_无咎.lsy的博客-CSDN博客

语言：python

框架：pytorch

工具：Anaconda 3

下面我们通过例子来具体学习Logistic回归：

import torch
from torch.autograd import Variable
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

#设置随机种子
torch.manual_seed(2017)

#从 data.txt 中读入点
with open('./data.txt','r') as f:
    data_list=[i.split('\n')[0].split(',')for i in f.readlines()]
    data = [(float(i[0]),float(i[1]),float(i[2])) for i in data_list]
    
#标准化
x0_max=max([i[0]for i in data])
x1_max=max([i[1] for i in data])
data =[(i[0]/x0_max,i[1]/x1_max,i[2] ) for i in data]

x0=list(filter(lambda x:x[-1] ==0.0,data)) #选择第一类的点
x1=list(filter(lambda x:x[-1]==1.0,data))  #选择第二类的点

plot_x0 = [i[0] for i in x0]
plot_y0 = [i[1]for i in x0]
plot_x1 = [i[0] for i in x1]
plot_y1 = [i[1] for i in x1]

plt.plot(plot_x0,plot_y0,'ro',label='x_0')
plt.plot(plot_x1,plot_y1,'bo',label='x_1')
plt.legend(loc='best'),L

接下来我们将数据转换成Numpy的类型，接着转换到tensor为之后的训练做准备

np_data = np.array(data,dtype='float32') #转换成numpy array
x_data = torch.from_numpy(np_data[:,0:2]) #转换成tensor,大小是【100，2】
y_data = torch.from_numpy(np_data[:,-1]).unsqueeze(1) #转换成tensor,大小为【100，1】

下面我们来定义sigmoid函数:

def sigmoid(x):
    return 1/(1+np.exp(-x))

画出sigmoid函数:

#画出sigmoid函数
plot_x=np.arange(-10,10.01,0.01)
plot_y=sigmoid(plot_x)

plt.plot(plot_x,plot_y,'r')

x_data = Variable(x_data)
y_data = Variable(y_data)

在Pytorch中，不需要我们自己写sigmoid的函数，Pytorch已经用底层的C++语言为我们写好了一些常用的函数，不仅方便我们使用，同时速度上比我们自己实现的更快，稳定性更好。通过导入 torch.nn.functional来使用，下面就是使用方法

import torch.nn.functional as F

# 定义 logistic 回归模型
w = Variable(torch.randn(2, 1), requires_grad=True) 
b = Variable(torch.zeros(1), requires_grad=True)

def logistic_regression(x):
    return torch.sigmoid(torch.mm(x, w) + b)

在更新之前，我们可以画出分类的效果:

# 计算loss
def binary_loss(y_pred, y):
    logits = (y * y_pred.clamp(1e-12).log() + (1 - y) * (1 - y_pred).clamp(1e-12).log()).mean()
    return -logits

y_pred = logistic_regression(x_data)
loss = binary_loss(y_pred, y_data)
print(loss)

tensor(0.6363, grad_fn=<NegBackward0>)

得到loss之后，我们可以用梯度下降的方法来更新参数

# 自动求导并更新参数
loss.backward()
w.data = w.data - 0.1 * w.grad.data
b.data = b.data - 0.1 * b.grad.data

# 算出一次更新之后的loss
y_pred = logistic_regression(x_data)
loss = binary_loss(y_pred, y_data)
print(loss)

tensor(0.6360, grad_fn=<NegBackward0>)

上面的参数更新方式其实是繁琐的重复操作，如果我们的参数很多，比如有 100 个，那么我们需要写 100 行来更新参数，为了方便，我们可以写成一个函数来更新，其实 PyTorch 已经为我们封装了一个函数来做这件事，这就是 PyTorch 中的优化器 torch.optim¶

使用 torch.optim 需要另外一个数据类型，就是 nn.Parameter，这个本质上和 Variable 是一样的，只不过 nn.Parameter 默认是要求梯度的，而 Variable 默认是不求梯度的

使用 torch.optim.SGD 可以使用梯度下降法来更新参数，PyTorch 中的优化器有更多的优化算法，在后面的内容中我们会更加详细的介绍

将参数 w 和 b 放到 torch.optim.SGD 中之后，说明一下学习率的大小，就可以使用 optimizer.step() 来更新参数了，比如下面我们将参数传入优化器，学习率设置为 1.0

# 使用 torch.optim 更新参数
from torch import nn
w = nn.Parameter(torch.randn(2, 1))
b = nn.Parameter(torch.zeros(1))

def logistic_regression(x):
    return torch.sigmoid(torch.mm(x, w) + b)

optimizer = torch.optim.SGD([w, b], lr=1.)

# 进行 1000 次更新
import time

start = time.time()
for e in range(1000):
    # 前向传播
    y_pred = logistic_regression(x_data)
    loss = binary_loss(y_pred, y_data) # 计算 loss
    # 反向传播
    optimizer.zero_grad() # 使用优化器将梯度归 0
    loss.backward()
    optimizer.step() # 使用优化器来更新参数
    # 计算正确率
    mask = y_pred.ge(0.5).float()
    acc = (mask == y_data).sum().item() / y_data.shape[0]
    if (e + 1) % 200 == 0:
        print('epoch: {}, Loss: {:.5f}, Acc: {:.5f}'.format(e+1, loss.item(), acc))
during = time.time() - start
print()
print('During Time: {:.3f} s'.format(during))

epoch: 200, Loss: 0.39401, Acc: 0.91000
epoch: 400, Loss: 0.32355, Acc: 0.91000
epoch: 600, Loss: 0.29010, Acc: 0.91000
epoch: 800, Loss: 0.27043, Acc: 0.91000
epoch: 1000, Loss: 0.25741, Acc: 0.90000

During Time: 0.354 s

可以看到使用优化器之后更新参数非常简单，只需要在自动求导之前使用optimizer.zero_grad() 来归 0 梯度，然后使用 optimizer.step()来更新参数就可以了，非常简便同时经过了 1000 次更新，loss 也降得比较低了¶

下面我们画出更新之后的结果

可以看到更新之后模型已经能够基本将这两类点分开了¶

前面我们使用了自己写的 loss，其实 PyTorch 已经为我们写好了一些常见的 loss，比如线性回归里面的 loss 是 nn.MSE()，而 Logistic 回归的二分类 loss 在 PyTorch 中是 nn.BCEWithLogitsLoss()，关于更多的 loss，可以查看文档

PyTorch 为我们实现的 loss 函数有两个好处，第一是方便我们使用，不需要重复造轮子，第二就是其实现是在底层 C++ 语言上的，所以速度上和稳定性上都要比我们自己实现的要好

另外，PyTorch 出于稳定性考虑，将模型的 Sigmoid 操作和最后的 loss 都合在了 nn.BCEWithLogitsLoss()，所以我们使用 PyTorch 自带的 loss 就不需要再加上 Sigmoid 操作了

# 使用自带的loss
criterion = nn.BCEWithLogitsLoss() # 将 sigmoid 和 loss 写在一层，有更快的速度、更好的稳定性

w = nn.Parameter(torch.randn(2, 1))
b = nn.Parameter(torch.zeros(1))

def logistic_reg(x):
    return torch.mm(x, w) + b

optimizer = torch.optim.SGD([w, b], 1.)

y_pred = logistic_reg(x_data)
loss = criterion(y_pred, y_data)
print(loss.data)

tensor(0.7911)

# 同样进行 1000 次更新

start = time.time()
for e in range(1000):
    # 前向传播
    y_pred = logistic_reg(x_data)
    loss = criterion(y_pred, y_data)
    # 反向传播
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
    # 计算正确率
    mask = y_pred.ge(0.5).float()
    acc = (mask == y_data).sum().item() / y_data.shape[0]
    if (e + 1) % 200 == 0:
        print('epoch: {}, Loss: {:.5f}, Acc: {:.5f}'.format(e+1, loss.item(), acc))

during = time.time() - start
print()
print('During Time: {:.3f} s'.format(during))

epoch: 200, Loss: 0.32778, Acc: 0.88000
epoch: 400, Loss: 0.29239, Acc: 0.87000
epoch: 600, Loss: 0.27187, Acc: 0.87000
epoch: 800, Loss: 0.25840, Acc: 0.87000
epoch: 1000, Loss: 0.24887, Acc: 0.89000

During Time: 0.224 s

【机器学习】Logistic 回归（pytorch）实现

猜你喜欢