Skip to content

Commit d06eb65

Browse files
committed
修正了部分文档中的笔误
1 parent 8e9a155 commit d06eb65

File tree

2 files changed

+7
-19
lines changed

2 files changed

+7
-19
lines changed

Day81-90/81.浅谈机器学习.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -305,7 +305,7 @@ for income in incomes:
305305
现在,我们的问题就变成了如何利用收集到的历史数据计算出回归模型的斜率 $\small{a}$ 和截距 $\small{b}$ 。为了评价回归模型的好坏,也就是我们计算出的斜率和截距是否理想,我们可以先定义评判标准,一个简单且直观的评判标准就是我们将月收入 $\small{X}$ 带入回归模型,计算出月网购支出的预测值 $\small{\hat{Y}}$ ,预测值 $\small{\hat{Y}}$ 和真实值 $\small{Y}$ 之间的误差越小,说明我们的回归模型越理想。之前我们提到过,计算误差的地方通常都需要取绝对值或者求平方,我们可以用误差平方的均值来作为评判标准,通常称之为均方误差(MSE),如下所示。
306306

307307
$$
308-
MSE = \frac{1}{n}{\sum_{i=1}^{n}(y_{i} - \hat{y}_{i})^{2}}
308+
MSE = \frac{1}{n}{\sum_{i=1}^{n}(y_{i} - \hat{y_{i}})^{2}}
309309
$$
310310

311311
根据上面的公式,我们可以写出计算均方误差的函数,通常称之为损失函数。

Day81-90/85.回归模型.md

Lines changed: 6 additions & 18 deletions
Original file line numberDiff line numberDiff line change
@@ -57,10 +57,10 @@ $$
5757

5858
### 回归系数的计算
5959

60-
建立回归模型的关键是找到最佳的回归系数 $\small{\mathbf{\beta}}$ ,所谓最佳回归系数是指让模型对数据的拟合效果达到最好的模型参数,即能够最小化模型的预测值 $\small{\hat{y}_{i}}$ 与实际观测值 $\small{y_{i}}$ 之间差异的模型参数。为此,我们先定义如下所示的损失函数。
60+
建立回归模型的关键是找到最佳的回归系数 $\small{\mathbf{\beta}}$ ,所谓最佳回归系数是指让模型对数据的拟合效果达到最好的模型参数,即能够最小化模型的预测值 $\small{\hat{y_{i}}}$ 与实际观测值 $\small{y_{i}}$ 之间差异的模型参数。为此,我们先定义如下所示的损失函数。
6161

6262
$$
63-
L(\mathbf{\beta}) = \sum_{i=1}^{m}(y_{i} - \hat{y}_{i})^{2}
63+
L(\mathbf{\beta}) = \sum_{i=1}^{m}(y_{i} - \hat{y_{i}})^{2}
6464
$$
6565

6666
其中, $\small{m}$ 表示样本容量,代入回归模型,有:
@@ -261,19 +261,19 @@ print('截距:', model.intercept_)
261261
1. 均方误差(Mean Squared Error, MSE)。MSE 是回归模型最常用的评估指标之一,定义为预测值与真实值误差的平方平均值。
262262

263263
$$
264-
\text{MSE} = \frac{1}{m} \sum_{i=1}^{m}(y_{i} - \hat{y}_{i})^{2}
264+
\text{MSE} = \frac{1}{m} \sum_{i=1}^{m}(y_{i} - \hat{y_{i}})^{2}
265265
$$
266266

267267
2. 均方根误差(Root Mean Squared Error, RMSE)。RMSE 是 MSE 的平方根形式,用于更直观地衡量误差的实际尺度(单位与目标变量一致)。
268268

269269
$$
270-
\text{RMSE} = \sqrt{\text{MSE}} = \sqrt{\frac{1}{m} \sum_{i=1}^{m}(y_{i} - \hat{y}_{i})^{2}}
270+
\text{RMSE} = \sqrt{\text{MSE}} = \sqrt{\frac{1}{m} \sum_{i=1}^{m}(y_{i} - \hat{y_{i}})^{2}}
271271
$$
272272

273273
3. 平均绝对误差(Mean Absolute Error, MAE)。MAE 是另一个常用的误差度量指标,定义为预测值与真实值误差的绝对值平均值。
274274

275275
$$
276-
\text{MAE} = \frac{1}{m} \sum_{i=1}^{m} \lvert y_{i} - \hat{y}_{i} \rvert
276+
\text{MAE} = \frac{1}{m} \sum_{i=1}^{m} \lvert y_{i} - \hat{y_{i}} \rvert
277277
$$
278278

279279
4. 决定系数(R-Squared, $\small{R^{2}}$)。 $\small{R^{2}}$ 是一个相对指标,用于衡量模型对数据的拟合程度,其值越接近 1 越好。 $\small{R^{2}}$ 的计算公式为:
@@ -282,19 +282,7 @@ $$
282282
R^{2} = 1 - \frac{SS_{res}}{{SS}_{tot}}
283283
$$
284284

285-
其中,
286-
287-
$$
288-
SS_{res} = \sum_{i=1}^{m}(y_{i} - \hat{y}_{i})^{2}
289-
$$
290-
291-
为残差平方和;
292-
293-
$$
294-
SS_{tot} = \sum_{i=1}^{m} (y_{i} - \bar{y})^{2}
295-
$$
296-
297-
为总平方和。
285+
其中, $\small{SS_{res} = \sum_{i=1}^{m}(y_{i} - \hat{y_{i}})^{2}}$ 为残差平方和; $\small{SS_{tot} = \sum_{i=1}^{m} (y_{i} - \bar{y})^{2}}$ 为总平方和,如下图所示。
298286

299287
<img src="res/05_regression_r2.png" style="zoom:40%;">
300288

0 commit comments

Comments
 (0)