逻辑回归理论精要

逻辑回归
线性回归是特征的线性组合来拟合真实标记,逻辑回归是特征的线性组合拟合真实标记的正例的概率的对数几率
 
a.假设有模型P(Y=1|x)=F(x)=11+e−θTxP(Y=1|x)=F(x)=11+e−θTx在已知输入x的情况下,判断此输入为1类的概率是多少。
b.而在此概率模型中,若想求得概率P,只有参数θTθT不知道。
c.如何求得参数θTθT,就需要估计参数值。参数估计方法则采用在模型已知,参数未知的情况下的极大似然估计。
d.若采用极大似然估计方法来估计参数,那么就需要给出似然函数。在整个模型训练中,似然函数如何表示?问题转化成如何表达极大似然估计函数
 
 
 
 

逻辑回归,softmax回归,最大熵模型
都属于对数线性模型,逻辑回归和softmax回归基于条件概率模型,N重伯努利分布,最大熵以期望为准,采用线性模型,假设特征之间独立。
 
逻辑回归:分类是回归问题的一个分类,逻辑回归可以多个角度理解,概率解释和最小对数损失,直接的理解是线性回归离散化,二分类问题。逻辑回归服从伯努利分布,通过极大似然估计,通过梯度下降法,降低损失。
 
交叉熵:两个概率分布的距离,或者概率q表达概率p的困难程度,q为预测值;
互信息:两个随机变量相关性的大小,已知一个变量,另一个变量不确定性减少的程度
相对熵(KL散度):同一个随机变量对两个概率分布p(x),q(x)的差异性,用概率q来近似P时造成的信息损失量
JS散度:一种对称的衡量两个分布相似度的度量方式。
 
 

猜你喜欢

转载自www.cnblogs.com/Christbao/p/12022177.html