sklearn
面向机器学习的python开源框架。
sklearn官方网站
sklearn中文网
sklearn.preprocessing.StandardScaler
通过去除均值并缩放到单位方差来标准化特征。
公式如下:
$z = \frac{x-\mu}{\sigma}$
其中,$\mu$是训练样本的平均值,$\sigma$是训练样本的标准差。
from sklearn.preprocessing import StandardScaler
StandardScaler(copy=True, with_mean=True, with_std=True)
- 参数:
copy: 布尔值,默认为True.
如果为False,则就地缩放,不生成新对象。
with_mean: 布尔值,默认为True.
如果为True, 则在缩放之前尝试将数据居中。
with_std: 布尔值,默认为True.
如果为True, 则将数据缩放到单位方差。
- 属性:
scale_: ndarray or None
每个特征的数据相对缩放。
mean_: ndarray or None
训练集中每个特征的平均值。
var_: ndarray of None
训练集中每个特征的方差。
n_samples_seen_: int or array
为每个特征处理的样本数。没有缺失值的话为整数,否则为数组。
- 方法:
fit(self, X, y=None)
计算均值和std用于以后的缩放。
fit_transform(self, X, y=None, **fit_params)
计算均值和std,然后对其进行转换。
参数:
X: numpy数组,训练集。
y: numpy数组,目标值。
**fit_params: dict, 其他拟合参数。
返回值:
numpy数组,转换后的数组。
get_params(self, deep=True)*
获取此估计量的参数。
inverse_transform(self, X, copy=None)
将数据按比例缩放到原始形式
partial_fit(self, X, y=None)
在线计算X上的平均值和std, 以便以后缩放。
set_params(self, **params)
设置此估算器的参数。
transform(self, X, copy=None)
通过居中和缩放来执行标准化。