|
57 | 57 |
|
58 | 58 | ### 回归系数的计算
|
59 | 59 |
|
60 |
| -建立回归模型的关键是找到最佳的回归系数 $\small{\mathbf{\beta}}$ ,所谓最佳回归系数是指让模型对数据的拟合效果达到最好的模型参数,即能够最小化模型的预测值 $\small{\hat{y}_{i}}$ 与实际观测值 $\small{y_{i}}$ 之间差异的模型参数。为此,我们先定义如下所示的损失函数。 |
| 60 | +建立回归模型的关键是找到最佳的回归系数 $\small{\mathbf{\beta}}$ ,所谓最佳回归系数是指让模型对数据的拟合效果达到最好的模型参数,即能够最小化模型的预测值 $\small{\hat{y_{i}}}$ 与实际观测值 $\small{y_{i}}$ 之间差异的模型参数。为此,我们先定义如下所示的损失函数。 |
61 | 61 |
|
62 | 62 | $$
|
63 |
| -L(\mathbf{\beta}) = \sum_{i=1}^{m}(y_{i} - \hat{y}_{i})^{2} |
| 63 | +L(\mathbf{\beta}) = \sum_{i=1}^{m}(y_{i} - \hat{y_{i}})^{2} |
64 | 64 | $$
|
65 | 65 |
|
66 | 66 | 其中, $\small{m}$ 表示样本容量,代入回归模型,有:
|
@@ -261,19 +261,19 @@ print('截距:', model.intercept_)
|
261 | 261 | 1. 均方误差(Mean Squared Error, MSE)。MSE 是回归模型最常用的评估指标之一,定义为预测值与真实值误差的平方平均值。
|
262 | 262 |
|
263 | 263 | $$
|
264 |
| -\text{MSE} = \frac{1}{m} \sum_{i=1}^{m}(y_{i} - \hat{y}_{i})^{2} |
| 264 | +\text{MSE} = \frac{1}{m} \sum_{i=1}^{m}(y_{i} - \hat{y_{i}})^{2} |
265 | 265 | $$
|
266 | 266 |
|
267 | 267 | 2. 均方根误差(Root Mean Squared Error, RMSE)。RMSE 是 MSE 的平方根形式,用于更直观地衡量误差的实际尺度(单位与目标变量一致)。
|
268 | 268 |
|
269 | 269 | $$
|
270 |
| -\text{RMSE} = \sqrt{\text{MSE}} = \sqrt{\frac{1}{m} \sum_{i=1}^{m}(y_{i} - \hat{y}_{i})^{2}} |
| 270 | +\text{RMSE} = \sqrt{\text{MSE}} = \sqrt{\frac{1}{m} \sum_{i=1}^{m}(y_{i} - \hat{y_{i}})^{2}} |
271 | 271 | $$
|
272 | 272 |
|
273 | 273 | 3. 平均绝对误差(Mean Absolute Error, MAE)。MAE 是另一个常用的误差度量指标,定义为预测值与真实值误差的绝对值平均值。
|
274 | 274 |
|
275 | 275 | $$
|
276 |
| -\text{MAE} = \frac{1}{m} \sum_{i=1}^{m} \lvert y_{i} - \hat{y}_{i} \rvert |
| 276 | +\text{MAE} = \frac{1}{m} \sum_{i=1}^{m} \lvert y_{i} - \hat{y_{i}} \rvert |
277 | 277 | $$
|
278 | 278 |
|
279 | 279 | 4. 决定系数(R-Squared, $\small{R^{2}}$)。 $\small{R^{2}}$ 是一个相对指标,用于衡量模型对数据的拟合程度,其值越接近 1 越好。 $\small{R^{2}}$ 的计算公式为:
|
|
282 | 282 | R^{2} = 1 - \frac{SS_{res}}{{SS}_{tot}}
|
283 | 283 | $$
|
284 | 284 |
|
285 |
| -其中, |
286 |
| - |
287 |
| -$$ |
288 |
| -SS_{res} = \sum_{i=1}^{m}(y_{i} - \hat{y}_{i})^{2} |
289 |
| -$$ |
290 |
| - |
291 |
| -为残差平方和; |
292 |
| - |
293 |
| -$$ |
294 |
| -SS_{tot} = \sum_{i=1}^{m} (y_{i} - \bar{y})^{2} |
295 |
| -$$ |
296 |
| - |
297 |
| -为总平方和。 |
| 285 | +其中, $\small{SS_{res} = \sum_{i=1}^{m}(y_{i} - \hat{y_{i}})^{2}}$ 为残差平方和; $\small{SS_{tot} = \sum_{i=1}^{m} (y_{i} - \bar{y})^{2}}$ 为总平方和,如下图所示。 |
298 | 286 |
|
299 | 287 | <img src="res/05_regression_r2.png" style="zoom:40%;">
|
300 | 288 |
|
|
0 commit comments