python 实现感知器

基础知识不再重述，可参考https://www.zybuluo.com/hanbingtao/note/433855

直接贴出文章里的代码以供参考学习，这里主要是为了锻炼自己的编写代码的能力，之前一直是过程式的编程，这里锻炼自己面向对象的编程能力。

# -*- coding: utf-8 -*-

# 这里定义一个感知器的类
class Perceptron(object):

    def __init__(self, input_num, activator):
        '''
        初始化感知器，设置输入参数的个数，以及激活函数。
        激活函数的类型为double -> double
        '''
        self.activator = activator
        # 权重向量初始化为0.0
        self.weights = [0.0 for _ in range(input_num)]
        # 偏置项初始化为0.0
        self.bias = 0.0

    def __str__(self): # __str__:类实例字符串化函数
        '''
        打印学习到的权重、偏置项
        '''
        return 'weights\t:%s\nbias\t:%f\n' % (self.weights, self.bias)

    def predict(self, input_vec):
        '''
        输入向量，输出感知器的计算结果
        '''
        # 把input_vec[x1,x2,x3...]和weights[w1,w2,w3,...]打包在一起
        # 变成[(x1,w1),(x2,w2),(x3,w3),...]
        # 然后利用map函数计算[x1*w1, x2*w2, x3*w3]
        # 最后利用reduce求和:reduce()还可以接收第3个可选参数，作为计算的初始值
        xi_wi=map(lambda (x, w): x * w,zip(input_vec, self.weights))
        # 激活函数的输入为w_1*x_1+w_2*x_2+bias
        return self.activator(reduce(lambda a, b: a + b,xi_wi , 0.0) + self.bias)

    def train(self, input_vecs, labels, iteration, rate):
        '''
        输入训练数据：一组向量、与每个向量对应的label；以及训练轮数、学习率
        '''
        # 每次迭代都把所有的样本输入
        for i in range(iteration):
            self._one_iteration(input_vecs, labels, rate)

    def _one_iteration(self, input_vecs, labels, rate):
        '''
        一次迭代，把所有的训练数据过一遍
        '''
        # 把输入和输出打包在一起，成为样本的列表[(input_vec, label), ...]
        # 而每个训练样本是(input_vec, label)
        samples = zip(input_vecs, labels)
        # 对每个样本，按照感知器规则更新权重
        for (input_vec, label) in samples:
            # 计算感知器在当前权重下的输出
            output = self.predict(input_vec)
            # 更新权重
            self._update_weights(input_vec, output, label, rate)

    def _update_weights(self, input_vec, output, label, rate):
        '''
        按照感知器规则更新权重
        '''
        # 把input_vec[x1,x2,x3,...]和weights[w1,w2,w3,...]打包在一起
        # 变成[(x1,w1),(x2,w2),(x3,w3),...]
        # 然后利用感知器规则更新权重
        delta = label - output
        self.weights = map(lambda (x, w): w + rate * delta * x,
                           zip(input_vec, self.weights))
        # 更新bias
        self.bias += rate * delta

def f(x):
    '''
    定义激活函数f：阶跃函数
    '''
    return 1 if x > 0 else 0

def get_training_dataset():
    '''
    基于and真值表构建训练数据
    '''
    # 构建训练数据
    # 输入向量列表
    input_vecs = [[1,1], [0,0], [1,0], [0,1]]
    # 期望的输出列表，注意要与输入一一对应
    # [1,1] -> 1, [0,0] -> 0, [1,0] -> 0, [0,1] -> 0
    labels = [1, 0, 0, 0]
    return input_vecs, labels   

def train_and_perceptron():
    '''
    使用and真值表训练感知器
    '''
    # 创建感知器，输入参数个数为2（因为and是二元函数），激活函数为f
    p = Perceptron(2, f)
    # 获得标准的训练数据
    input_vecs, labels = get_training_dataset()
    # 训练，迭代10轮, 学习速率为0.1
    p.train(input_vecs, labels, 10, 0.1)
    #返回训练好的感知器
    return p


if __name__ == '__main__': 
    # 训练and感知器
    and_perception = train_and_perceptron()
    # 打印训练获得的权重
    print and_perception
    # 测试
    print '1 and 1 = %d' % and_perception.predict([1, 1])
    print '0 and 0 = %d' % and_perception.predict([0, 0])
    print '1 and 0 = %d' % and_perception.predict([1, 0])
    print '0 and 1 = %d' % and_perception.predict([0, 1])

运行结果哦：

weights :[0.1, 0.2]
bias    :-0.200000

1 and 1 = 1
0 and 0 = 0
1 and 0 = 0
0 and 1 = 0

代码已经有详细的注释，只需注意以下几个地方就好。

笔记

由于这里的感知器是训练的简单的与或非运算，目标输出都是0、1值，所以激活函数用阶跃函数，如果目标输出是-1、+1值，此时用符号函数（sign）作为激活函数，所以激活函数的选取是要看目标输出值的形式。
注意这里的权重更新为：
$w_{i} \leftarrow w_{i} + η (t - y) x_{i} b \leftarrow b + η (t - y)$ $w_i \leftarrow w_i+\eta(t-y)x_i \\ b \leftarrow b+\eta(t-y)$
$t$ 是训练样本的实际值，一般称之为label。而 $y$ 是感知器的输出值
reduce()函数也是Python内置的一个高阶函数。
reduce()函数接收的参数和 map()类似，一个函数 f，一个list，但行为和 map()不同，reduce()传入的函数 f 必须接收两个参数，reduce()对list的每个元素反复调用函数f，并返回最终结果值
reduce()还可以接收第3个可选参数，作为计算的初始值
__str__方法和__init__方法类似，都是一些特殊方法，所以前后都有双下划线，它用来返回对象的字符串表达式.事实上。__str__是被print函数调用的，一般都是return一个字符串。当打印一个类的时候，那么print首先调用的就是类里面的定义的__str__。

通过这段简单的代码可以看出利用对象来实现算法的一个流程，自己在这方面还是相对薄弱，有待以后的学习和加强。

笔记

猜你喜欢