AIC信息

假设 $f$ 为可以反映真实情况的理想模型， $g$ 为用来近似真实情况的模型。两个模型见的 $Kullback-Leibler$ 信息距离（ $K-L$ 距离）是指有模型 $g$ 来近似 $f$ 所带来的信息损失。简称 $g$ 到 $f$ 的距离， $K-L$ 距离由式 $(1)$ 表示。

\begin{matrix} (1) & I (f, g) = \int f (x) l o g ⟮ \frac{f (x)}{f (x | θ)} ⟯ d x \end{matrix}

$I(f,g)=\int f(x)log \lgroup \frac {f(x)} {f(x|\theta)} \rgroup dx \tag1$

$g$ 到 $f$ 的 $K-L$ 距离越小，则代表模型 $g$ 越好。整理式 $(1)$ 可知， $K-L$ 距离可以由两个 $f$ 的期望来表示，其中，第一个期望是仅与未知的真实集 $f$ 相关的定值。

\begin{matrix} (2) & \begin{aligned} I (f, g) & = \int f (x) l o g (f (x)) d x - \int f (x) l o g (g (x | θ)) d x \\ = E_{f} [l o g (f (x))] - E_{f} [l o g (g (x | θ))] \\ = C - E_{f} [l o g (g (x | θ))] \end{aligned} \end{matrix}

$\begin{equation} \begin{aligned} I(f,g) &=\int f(x)log(f(x))dx - \int f(x)log(g(x|\theta))dx \\ &= E_f[log(f(x))]-E_f[log(g(x|\theta))] \\ &= C-E_f[log(g(x|\theta))] \end{aligned} \tag 2 \end{equation}$
则可以定义相对

K - L

$K-L$ 距离，比较不用模型

g

$g$ 的相对

K - L 的

$K-L的$ 距离大小，同样可以对模型优劣程度做比较

\begin{matrix} (3) & I (f, g) - C = - E_{f} [l o g (g (x | θ))] \end{matrix}

$I(f,g) -C=-E_f[log(g(x|\theta))] \tag 3$
相对于

K - L

$K-L$ 距离在实际模型比较重仍然不适用，因为相对

K - L

$K-L$ 距离的计算依赖于真实集

f

$f$ ，

A k a i k e

$Akaike$ 提出了一种估计

K - L

$K-L$ 距离的特定方法。给定一个模型形式

g

$g$ ，存在一个特定模型参数

θ_{0}

$\theta _0$ ，使得

g

$g$ 到

f

$f$ 的

K - L

$K-L$ 距离最小。这个特定的模型参数

θ_{0}

$\theta_0$ 依赖于真实集

f

$f$ ，模型形式

g

$g$ ，以及样本集

x

$x$ 。所以，

A k a i k e

$Akaike$ 提出用极大似然估计出的

\hat{θ}

$\hat \theta$ 来估计

θ_{0}

$\theta_0$ ，则模型挑选准则从相对

K - L

$K-L$ 距离的比较进一步转化成对期望估计的

K - L

$K-L$ 距离的比较：

\begin{matrix} (4) & E_{y} E_{x} [l o g ⟮ g ⟮ x | \hat{θ} (y) ⟯ ⟯] \end{matrix}

$E_yE_x[log \lgroup g \lgroup x|\hat\theta(y) \rgroup \rgroup] \tag 4$

A k a i k e

$Akaike$ 发现这个

K - L

$K-L$ 距离的估计在实际情况中，存在过估计，过估计的量近似等于需要估计的模型参数个数

K + 1

$K+1$ 。即

\begin{matrix} (5) & l o g ⟮ L ⟮ \hat{θ} | d a t a ⟯ ⟯ - (k + 1) = C - {\hat{E}}_{\hat{θ}} ⟮ I ⟮ f, \hat{g} ⟯ ⟯ \end{matrix}

$log \lgroup L \lgroup \hat \theta|data \rgroup \rgroup-(k+1) = C - \hat E_{\hat \theta}\lgroup I \lgroup f,\hat g \rgroup\rgroup \tag 5$
因此，

A k a i k e

$Akaike$ 定义了期望相对

K - L

$K-L$ 距离来作为模型挑选的准则，称为

A k a i k e

$Akaike$ 信息准则

（ A k a i k e^{'} s i n f o r m a t i o n C r i t e r i o n, A I C)

$（Akaike's information Criterion ,AIC)$ ，即：

A I C = - 2 l o g ⟮ L ⟮ \hat{θ} | y ⟯ ⟯ + 2 (k + 1)

$AIC = -2log \lgroup L \lgroup \hat \theta|y \rgroup\rgroup +2(k+1)$
特别的，用最小二乘法估计的方法简化上式，则

A I C

$AIC$ 可进一步表示为：

\begin{matrix} (6) & A I C = n l o g ⟮ {\hat{σ}}^{2} ⟯ + 2 (k + 1) \end{matrix}

$AIC = nlog \lgroup \hat \sigma^2 \rgroup+2(k+1) \tag 6$
式中，

{\hat{σ}}^{2}

$\hat \sigma^2$ 是

σ^{2}

$\sigma^2$ 的极大似然估计；

n

$n$ 为样本大小；

R S S

$RSS$ 为残差平方和。

\begin{matrix} (7) & {\hat{σ}}^{2} = \frac{R S S}{n} \end{matrix}

$\hat \sigma^2 = \frac {RSS} {n} \tag 7$

AIC信息

AIC信息

猜你喜欢