fit()
:用于从训练数据生成学习模型参数
transform()
:从fit()
方法生成的参数,应用于模型以生成转换数据集。
fit_transform()
:在同一数据集上组合fit()
和transform()
api
要使数据归一化(使其均值为0和方差为1),使减去平均值,然后将结果除以标准偏差。
可以在训练数据集上执行此操作。但是,必须将相同的转换应用于测试集(例如交叉验证),或者在预测之前应用于新获得的示例。但是你必须使用相同的两个参数μ米和σp (值)用于归一化训练集。
因此,每个sklearn的变换fit()
只是计算参数(例如μ米和σp在StandardScaler的情况下)并将它们保存为内部对象状态。然后,您可以调用其transform()
方法将转换应用于特定的一组示例。
fit_transform()
加入这两个步骤,用于训练集x上的参数的初始拟合X,但它也返回一个转换后的x′X′。在内部,它只是先调用fit()
然后调用transform()
相同的数据。