一、

1.激活函数

a. sigmoid函数：e=2.7182

$h(x)=\frac{1}{1+exp(-x)}$

使得神经网络中流动的是连续的实数值信号，平滑性

注：阶跃函数和sigmoid函数都属于非线性函数（线性函数 h(x)=cx ），神经网络的激活函数必须使用非线性函数

b. ReLU函数（Rectified Linear Unit）：输入大于0时，直接输出该值；小于等于0时，输出0

$h(x)=\left\{\begin{matrix} x (x>0)\\ 0(x\leq 0) \end{matrix}\right.$

输入层（0层）有两个神经元，第1个隐藏层（第1层）有3个神经元，第2个隐藏层（第2层）有两个神经元，输出层（第3层）有两个神经元

def softmax(a):
    c = np.max(a)
    exp_a = np.exp(a-c)
    sun_exp_a = np.sum(exp_a)
    y = exp_a/sun_exp_a
    return y

使用softmax出现的问题：当exp(a)中，a=1000时，结果为inf（无限大），溢出。在超大值之间进行除法运算时，结果会出现“不确定”的情况。

在使用softmax进行运算时，加上或减去某个常数不会改变运算的结果

注意：softmax函数输出值的总和为1

“学习”——从训练数据中自动获取最优权重参数的过程，引入损失函数——学习的目的，即损失函数尽可能小

在计算机视觉领域常用的特征量包括：SIFT、SURF、HOG

a. 均方误差（mean squared）

$E=\frac{1}{2}\sum_{k}(y_{k}-t_{k})^{2}$

b. 交叉熵误差（cross entropy error）

$E = - \sum_{k}t_{k}log(y_{k})$

导数：表示某个瞬间的变化量

$\frac{df(x)}{dx}=\lim_{h\rightarrow 0}\frac{f(x+h)-f(x)}{h}$

def numerical_diff(f,h):
    h=1e-4
    return (f(x+h)-f(x-h))/(2*h)