基础知识不再重述,可参考https://www.zybuluo.com/hanbingtao/note/433855
直接贴出文章里的代码以供参考学习,这里主要是为了锻炼自己的编写代码的能力,之前一直是过程式的编程,这里锻炼自己面向对象的编程能力。
# -*- coding: utf-8 -*-
# 这里定义一个感知器的类
class Perceptron(object):
def __init__(self, input_num, activator):
'''
初始化感知器,设置输入参数的个数,以及激活函数。
激活函数的类型为double -> double
'''
self.activator = activator
# 权重向量初始化为0.0
self.weights = [0.0 for _ in range(input_num)]
# 偏置项初始化为0.0
self.bias = 0.0
def __str__(self): # __str__:类实例字符串化函数
'''
打印学习到的权重、偏置项
'''
return 'weights\t:%s\nbias\t:%f\n' % (self.weights, self.bias)
def predict(self, input_vec):
'''
输入向量,输出感知器的计算结果
'''
# 把input_vec[x1,x2,x3...]和weights[w1,w2,w3,...]打包在一起
# 变成[(x1,w1),(x2,w2),(x3,w3),...]
# 然后利用map函数计算[x1*w1, x2*w2, x3*w3]
# 最后利用reduce求和:reduce()还可以接收第3个可选参数,作为计算的初始值
xi_wi=map(lambda (x, w): x * w,zip(input_vec, self.weights))
# 激活函数的输入为w_1*x_1+w_2*x_2+bias
return self.activator(reduce(lambda a, b: a + b,xi_wi , 0.0) + self.bias)
def train(self, input_vecs, labels, iteration, rate):
'''
输入训练数据:一组向量、与每个向量对应的label;以及训练轮数、学习率
'''
# 每次迭代都把所有的样本输入
for i in range(iteration):
self._one_iteration(input_vecs, labels, rate)
def _one_iteration(self, input_vecs, labels, rate):
'''
一次迭代,把所有的训练数据过一遍
'''
# 把输入和输出打包在一起,成为样本的列表[(input_vec, label), ...]
# 而每个训练样本是(input_vec, label)
samples = zip(input_vecs, labels)
# 对每个样本,按照感知器规则更新权重
for (input_vec, label) in samples:
# 计算感知器在当前权重下的输出
output = self.predict(input_vec)
# 更新权重
self._update_weights(input_vec, output, label, rate)
def _update_weights(self, input_vec, output, label, rate):
'''
按照感知器规则更新权重
'''
# 把input_vec[x1,x2,x3,...]和weights[w1,w2,w3,...]打包在一起
# 变成[(x1,w1),(x2,w2),(x3,w3),...]
# 然后利用感知器规则更新权重
delta = label - output
self.weights = map(lambda (x, w): w + rate * delta * x,
zip(input_vec, self.weights))
# 更新bias
self.bias += rate * delta
def f(x):
'''
定义激活函数f:阶跃函数
'''
return 1 if x > 0 else 0
def get_training_dataset():
'''
基于and真值表构建训练数据
'''
# 构建训练数据
# 输入向量列表
input_vecs = [[1,1], [0,0], [1,0], [0,1]]
# 期望的输出列表,注意要与输入一一对应
# [1,1] -> 1, [0,0] -> 0, [1,0] -> 0, [0,1] -> 0
labels = [1, 0, 0, 0]
return input_vecs, labels
def train_and_perceptron():
'''
使用and真值表训练感知器
'''
# 创建感知器,输入参数个数为2(因为and是二元函数),激活函数为f
p = Perceptron(2, f)
# 获得标准的训练数据
input_vecs, labels = get_training_dataset()
# 训练,迭代10轮, 学习速率为0.1
p.train(input_vecs, labels, 10, 0.1)
#返回训练好的感知器
return p
if __name__ == '__main__':
# 训练and感知器
and_perception = train_and_perceptron()
# 打印训练获得的权重
print and_perception
# 测试
print '1 and 1 = %d' % and_perception.predict([1, 1])
print '0 and 0 = %d' % and_perception.predict([0, 0])
print '1 and 0 = %d' % and_perception.predict([1, 0])
print '0 and 1 = %d' % and_perception.predict([0, 1])
运行结果哦:
weights :[0.1, 0.2]
bias :-0.200000
1 and 1 = 1
0 and 0 = 0
1 and 0 = 0
0 and 1 = 0
代码已经有详细的注释,只需注意以下几个地方就好。
笔记
- 由于这里的感知器是训练的简单的与或非运算,目标输出都是0、1值,所以激活函数用阶跃函数,如果目标输出是-1、+1值,此时用符号函数(sign)作为激活函数,所以激活函数的选取是要看目标输出值的形式。
- 注意这里的权重更新为:
是训练样本的实际值,一般称之为label。而 是感知器的输出值 - reduce()函数也是Python内置的一个高阶函数。
reduce()函数接收的参数和 map()类似,一个函数 f,一个list,但行为和 map()不同,reduce()传入的函数 f 必须接收两个参数,reduce()对list的每个元素反复调用函数f,并返回最终结果值
reduce()还可以接收第3个可选参数,作为计算的初始值 __str__
方法和__init__
方法类似,都是一些特殊方法,所以前后都有双下划线,它用来返回对象的字符串表达式.事实上。__str__
是被print函数调用的,一般都是return一个字符串。当打印一个类的时候,那么print首先调用的就是类里面的定义的__str__
。
通过这段简单的代码可以看出利用对象来实现算法的一个流程,自己在这方面还是相对薄弱,有待以后的学习和加强。