均方误差的公式可以通过以下步骤推导得出:
假设有n个样本,真实值分别为y₁, y₂, ……, yₙ,预测值分别为ŷ₁, ŷ₂, ……, ŷₙ。
首先,我们可以定义误差(error)为预测值与真实值之间的差:
eᵢ = yᵢ - ŷᵢ
则第i个样本的误差平方为:
eᵢ² = (yᵢ - ŷᵢ)²
我们希望得到所有样本误差平方的平均数,即均方误差。因此,我们可以计算所有样本误差平方的和,再除以样本数n:
MSE = (1/n) * Σ(yᵢ - ŷᵢ)² (i=1,2,…,n)
将误差平方代入上式,可以得到:
MSE = (1/n) * Σ(yᵢ - ŷᵢ)²
= (1/n) * (e₁² + e₂² + … + eₙ²)
= (1/n) * ((y₁ - ŷ₁)² + (y₂ - ŷ₂)² + … + (yₙ - ŷₙ)²)
继续化简,可以得到:
MSE = (1/n) * ((y₁² - 2y₁ŷ₁ + ŷ₁²) + (y₂² - 2y₂ŷ₂ + ŷ₂²) + … + (yₙ² - 2yₙŷₙ + ŷₙ²))
= (1/n) * (y₁² + y₂² + … + yₙ² - 2y₁ŷ₁ - 2y₂ŷ₂ - … - 2yₙŷₙ + ŷ₁² + ŷ₂² + … + ŷₙ²)
由于真实值的平方和常数,预测值的平方和常数,因此,我们可以将式子进一步简化:
MSE = (1/n) * (y₁² + y₂² + … + yₙ² - 2y₁ŷ₁ - 2y₂ŷ₂ - … - 2yₙŷₙ + ŷ₁² + ŷ₂² + … + ŷₙ²)
= (1/n) * (Σy² - 2Σ(yᵢŷᵢ) + Σŷ²)
= (1/n) * (Σy² - 2Σyᵢŷᵢ + Σŷ²)
因此,均方误差可以用样本真实值的平方和、样本真实值与预测值的乘积之和、样本预测值的平方和来计算。