Skip to content

Commit

Permalink
1.2.2 模型 done
Browse files Browse the repository at this point in the history
  • Loading branch information
goldmermaid authored and astonzhang committed Feb 17, 2021
1 parent b1cfaf1 commit a1213e3
Showing 1 changed file with 9 additions and 3 deletions.
12 changes: 9 additions & 3 deletions chapter_introduction/index.md
Original file line number Diff line number Diff line change
Expand Up @@ -108,7 +108,7 @@

毋庸置疑,如果没有数据,那么数据科学毫无用武之地。
每个数据集由一个个*样本*(example)组成,大多时候,它们遵循独立同分布(idependently and identically distributed, i.i.d.)。
样本有时也叫做*数据点*(data point)或者*数据实例*(data instance),通常每个样本由一组称为*特征*(features)(*协变量*(covariates))的属性组成。
样本有时也叫做*数据点*(data point)或者*数据实例*(data instance),通常每个样本由一组称为*特征*(features*协变量*(covariates))的属性组成。
机器学习模型会根据这些属性进行预测。
在上面的监督学习问题中,要预测的是一个特殊的属性,它被称为*标签*(label,或*目标*(target))。

Expand Down Expand Up @@ -141,13 +141,19 @@
一种常见的问题来着不均衡的数据集,比如在一个有关医疗的训练数据集中,某些人群没有样本表示。
想象一下,假设你要训练一个皮肤癌识别模型,但它(在训练数据集)从未见过的黑色皮肤的人群,就会顿时束手无策。

因此,当数据不具有充分代表性,甚至包含了一些社会偏见时,模型就很有可能失败。
再比如,如果用“过去的招聘决策数据”来训练一个筛选简历的模型,那么机器学习模型可能会无意中捕捉到历史残留的不公正,并将其自动化。
然而,这一切都可能在不知情的情况下发生。
因此,当数据不具有充分代表性,甚至包含了一些社会偏见时,模型就很有可能失败。


### 模型

大多数机器学习在某种意义上涉及到数据的转换。我们可能想建立一个系统,摄取照片并预测笑脸。或者,我们可能需要摄取一组传感器读数,并预测读数的正常与异常程度。通过*模型*,我们表示摄取一种类型的数据并输出可能不同类型的预测的计算机制。特别是,我们对可以从数据中估计的统计模型感兴趣。虽然简单的模型完全能够解决适当的简单问题,但我们在本书中关注的问题超出了经典方法的极限。深度学习与经典方法的区别主要在于它所关注的一组强大的模型。这些模型由许多从上到下链接在一起的数据的连续转换组成,因此被称为“深度学习”(deep learning)。在讨论深度模型的过程中,我们还将讨论一些更传统的方法。
大多数机器学习会涉及到数据的转换。
比如,我们建立一个“摄取照片并预测笑脸”的系统。再比如,我们摄取一组传感器读数,并预测读数的正常与异常程度。
虽然简单的模型能够解决简单问题,但本书中关注的问题超出了经典方法的极限。
深度学习与经典方法的区别主要在于:前者所关注的一组强大的模型,这些模型包含层层数据转换,由神经网络错综复杂的交织在一起,因此被称为*深度学习*(deep learning)。
在讨论深度模型的过程中,我们还将讨论一些更传统的方法。


### 目标函数

Expand Down

0 comments on commit a1213e3

Please sign in to comment.