標準化,歸一化和的概念与适用范围整理

網上講得比較亂
有些博客把歸一化和標準化認爲一致,主要是覺得normalization這個詞語翻譯成標準化和歸一化都沒啥問題

Min-Max scaling(歸一化),也可以使用normalization,但是谷歌上不推薦
,公式是:
在这里插入图片描述
網上通俗的說法是:用來消除量鋼的影響。
這個說法是不準確的,因爲有的特徵顯然需要比重大一些,有的需要比重小一些。
這個“消除量鋼影響”的說法其實是默認數據特徵是一視同仁、同等重要的。
歸一化用來處理行
效果是針對特徵對應的列之間的權重一致


z-score normalization(標準化),
有的博客認爲,由於Min-Max scaling也可以翻譯成Min-Max normalization
所以他們認爲歸一化也是一種報準化,這種說法也行,其實就是翻譯問題。
在这里插入图片描述
標準化是用來處理数据集的列。


岭回归和Lasso时候,SVM,KNN中,标准化是必须的
线性回归、逻辑回归、决策树、随机森林、梯度上升,不需要标准化

转载自:
https://blog.csdn.net/shwan_ma/article/details/80154888

中心化

猜你喜欢

转载自blog.csdn.net/appleyuchi/article/details/83582180