逻辑回归理论精要

逻辑回归

线性回归是特征的线性组合来拟合真实标记，逻辑回归是特征的线性组合拟合真实标记的正例的概率的对数几率

a.假设有模型P(Y=1|x)=F(x)=11+e−θTxP(Y=1|x)=F(x)=11+e−θTx在已知输入x的情况下，判断此输入为1类的概率是多少。

b.而在此概率模型中，若想求得概率P，只有参数θTθT不知道。

c.如何求得参数θTθT，就需要估计参数值。参数估计方法则采用在模型已知，参数未知的情况下的极大似然估计。

d.若采用极大似然估计方法来估计参数，那么就需要给出似然函数。在整个模型训练中，似然函数如何表示？问题转化成如何表达极大似然估计函数

：

逻辑回归，softmax回归，最大熵模型

都属于对数线性模型，逻辑回归和softmax回归基于条件概率模型，N重伯努利分布，最大熵以期望为准，采用线性模型，假设特征之间独立。

逻辑回归：分类是回归问题的一个分类，逻辑回归可以多个角度理解，概率解释和最小对数损失，直接的理解是线性回归离散化，二分类问题。逻辑回归服从伯努利分布，通过极大似然估计，通过梯度下降法，降低损失。

交叉熵：两个概率分布的距离，或者概率q表达概率p的困难程度，q为预测值；

互信息：两个随机变量相关性的大小，已知一个变量，另一个变量不确定性减少的程度

相对熵（KL散度）：同一个随机变量对两个概率分布p(x),q(x)的差异性，用概率q来近似P时造成的信息损失量

JS散度：一种对称的衡量两个分布相似度的度量方式。