Skip to content

Commit

Permalink
Improve translation and update video link (microsoft#336)
Browse files Browse the repository at this point in the history
* Update README.zh-cn.md

* Update README.zh-cn.md
  • Loading branch information
SIXiaolong1117 authored Sep 10, 2021
1 parent afcf365 commit 531b22a
Show file tree
Hide file tree
Showing 2 changed files with 5 additions and 5 deletions.
6 changes: 3 additions & 3 deletions 2-Regression/1-Tools/translations/README.zh-cn.md
Original file line number Diff line number Diff line change
Expand Up @@ -18,7 +18,7 @@

## 安装和配置

[![在 Visual Studio Code 中使用 Python](https://img.youtube.com/vi/7EXd4_ttIuw/0.jpg)](https://youtu.be/7EXd4_ttIuw "Visual Studio Code 中使用 Python")
[![在 Visual Studio Code 中使用 Python](https://img.youtube.com/vi/yyQM70vi7V8/0.jpg)](https://youtu.be/yyQM70vi7V8 "Setup Python with Visual Studio Code")

> 🎥 单击上图观看视频:在 VS Code 中使用 Python。
Expand Down Expand Up @@ -145,15 +145,15 @@ Scikit-learn 使构建模型和评估它们的使用变得简单。它主要侧

✅ 稍微思考一下数据和回归目标之间的关系。线性回归预测特征 X 和目标变量 y 之间的关系。你能在文档中找到糖尿病数据集的 [目标](https://scikit-learn.org/stable/datasets/toy_dataset.html#diabetes-dataset) 吗?鉴于该目标,该数据集展示了什么?

2. 接下来,通过使用 numpy 的 `newaxis` 函数将其排列到一个新数组中来选择要绘制的该数据集的一部分。我们将使用线性回归根据它确定的模式在此数据中的值之间生成一条线。
2. 接下来,通过使用 numpy 的 `newaxis` 函数将数据集的一部分排列到一个新数组中。我们将使用线性回归根据它确定的模式在此数据中的值之间生成一条线。

```python
X = X[:, np.newaxis, 2]
```

✅ 随时打印数据以检查其形状。

3. 现在你已准备好绘制数据,你可以查看机器是否可以帮助确定此数据集中数字之间的逻辑分割。为此你需要将数据 (X) 和目标 (y) 拆分为测试集和训练集。Scikit-learn 有一个简单的方法来做到这一点;你可以在给定点拆分测试数据。
3. 现在你已准备好绘制数据,你可以看到计算机是否可以帮助确定此数据集中数字之间的逻辑分割。为此你需要将数据 (X) 和目标 (y) 拆分为测试集和训练集。Scikit-learn 有一个简单的方法来做到这一点;你可以在给定点拆分测试数据。

```python
X_train, X_test, y_train, y_test = model_selection.train_test_split(X, y, test_size=0.33)
Expand Down
4 changes: 2 additions & 2 deletions 2-Regression/2-Data/translations/README.zh-cn.md
Original file line number Diff line number Diff line change
Expand Up @@ -16,11 +16,11 @@

## 对你的数据提出正确的问题

你需要回答的问题将决定你将使用哪种类型的 ML 算法。你得到的答案的质量将在很大程度上取决于你的数据的性质。
你提出的问题将决定你将使用哪种类型的 ML 算法。你得到的答案的质量将在很大程度上取决于你的数据的性质。

查看为本课程提供的[数据](../data/US-pumpkins.csv)。你可以在 VS Code 中打开这个 .csv 文件。快速浏览一下就会发现有空格,还有字符串和数字数据的混合。还有一个奇怪的列叫做“Package”,其中的数据是“sacks”、“bins”和其他值的混合。事实上,数据有点乱。

事实上,获得一个完全准备好用于创建开箱即用的ML模型的数据集并不是很常见。在本课中,你将学习如何使用标准 Python 库准备原始数据集。你还将学习各种技术来可视化数据。
事实上,得到一个完全准备好用于创建 ML 模型的开箱即用数据集并不是很常见。在本课中,你将学习如何使用标准 Python 库准备原始数据集。你还将学习各种技术来可视化数据。

## 案例研究:“南瓜市场”

Expand Down

0 comments on commit 531b22a

Please sign in to comment.