forked from microsoft/ML-For-Beginners
-
Notifications
You must be signed in to change notification settings - Fork 0
Commit
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
[Translations] Add traditional chinese translations (microsoft#599)
* Add Traditional Chinese translation * Add Traditional Chinese translation * Add files via upload * Add Traditional Chinese translation * Add Traditional Chinese translation
- Loading branch information
Showing
9 changed files
with
598 additions
and
0 deletions.
There are no files selected for viewing
103 changes: 103 additions & 0 deletions
103
1-Introduction/1-intro-to-ML/translations/README.zh-tw.md
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,103 @@ | ||
# 機器學習介紹 | ||
|
||
[](https://youtu.be/lTd9RSxS9ZE "機器學習,人工智能,深度學習-有什麽區別?") | ||
|
||
> 🎥 點擊上面的圖片觀看討論機器學習、人工智能和深度學習之間區別的視頻。 | ||
## [課前測驗](https://white-water-09ec41f0f.azurestaticapps.net/quiz/1/) | ||
|
||
### 介紹 | ||
|
||
歡迎來到這個經典機器學習的初學者課程!無論你是這個主題的新手,還是一個有經驗的 ML 從業者,我們都很高興你能加入我們!我們希望為你的 ML 研究創建一個好的開始,並很樂意評估、回應和接受你的[反饋](https://github.com/microsoft/ML-For-Beginners/discussions)。 | ||
|
||
[](https://youtu.be/h0e2HAPTGF4 "Introduction to ML") | ||
|
||
> 🎥 單擊上圖觀看視頻:麻省理工學院的 John Guttag 介紹機器學習 | ||
### 機器學習入門 | ||
在開始本課程之前,你需要設置計算機能在本地運行 Jupyter Notebooks。 | ||
|
||
- **按照這些視頻裏的講解配置你的計算機**。了解有關如何在此[視頻集](https://www.youtube.com/playlist?list=PLlrxD0HtieHhS8VzuMCfQD4uJ9yne1mE6)中設置計算機的更多信息。 | ||
- **學習 Python**。 還建議你對 [Python](https://docs.microsoft.com/learn/paths/python-language/?WT.mc_id=academic-15963-cxa) 有一個基本的了解。這是我們在本課程中使用的一種對數據科學家有用的編程語言。 | ||
- **學習 Node.js 和 JavaScript**。在本課程中,我們在構建 web 應用程序時也使用過幾次 JavaScript,因此你需要有 [Node.js](https://nodejs.org) 和 [npm](https://www.npmjs.com/) 以及 [Visual Studio Code](https://code.visualstudio.com/) 用於 Python 和 JavaScript 開發。 | ||
- **創建 GitHub 帳戶**。既然你在 [GitHub](https://github.com) 上找到我們,你可能已經有了一個帳戶,但如果沒有,請創建一個帳戶,然後 fork 此課程自己使用(也給我們一顆星星吧😊) | ||
- **探索 Scikit-learn**. 熟悉 [Scikit-learn]([https://scikit-learn.org/stable/user_guide.html),我們在這些課程中引用的一組 ML 庫。 | ||
|
||
### 什麽是機器學習? | ||
|
||
術語「機器學習」是當今最流行和最常用的術語之一。 如果你對科技有某種程度的熟悉,那麽很可能你至少聽說過這個術語一次,無論你在哪個領域工作。然而,機器學習的機製對大多數人來說是一個謎。 對於機器學習初學者來說,這個主題有時會讓人感到不知所措。 因此,了解機器學習的實質是什麽,並通過實例一步一步地了解機器學習是很重要的。 | ||
|
||
 | ||
|
||
> 谷歌趨勢顯示了「機器學習」一詞最近的「趨勢曲線」 | ||
我們生活在一個充滿迷人奧秘的宇宙中。像史蒂芬·霍金、阿爾伯特·愛因斯坦等偉大的科學家,以及更多的人,都致力於尋找有意義的信息,揭示我們周圍世界的奧秘。這就是人類學習的條件:一個人類的孩子在長大成人的過程中,一年又一年地學習新事物並揭示世界的結構。 | ||
|
||
孩子的大腦和感官感知到周圍的事實,並逐漸學習隱藏的生活模式,這有助於孩子製定邏輯規則來識別學習模式。人類大腦的學習過程使人類成為世界上最復雜的生物。不斷地學習,通過發現隱藏的模式,然後對這些模式進行創新,使我們能夠使自己在一生中變得越來越好。這種學習能力和進化能力與一個叫做[大腦可塑性](https://www.simplypsychology.org/brain-plasticity.html)的概念有關。從表面上看,我們可以在人腦的學習過程和機器學習的概念之間找到一些動機上的相似之處。 | ||
|
||
[人腦](https://www.livescience.com/29365-human-brain.html) 從現實世界中感知事物,處理感知到的信息,做出理性的決定,並根據環境執行某些行動。這就是我們所說的智能行為。當我們將智能行為過程的復製品編程到計算機上時,它被稱為人工智能 (AI)。 | ||
|
||
盡管這些術語可能會混淆,但機器學習 (ML) 是人工智能的一個重要子集。 **機器學習關註使用專門的算法來發現有意義的信息,並從感知數據中找到隱藏的模式,以證實理性的決策過程**。 | ||
|
||
 | ||
|
||
> 顯示 AI、ML、深度學習和數據科學之間關系的圖表。圖片作者 [Jen Looper](https://twitter.com/jenlooper),靈感來自[這張圖](https://softwareengineering.stackexchange.com/questions/366996/distinction-between-ai-ml-neural-networks-deep-learning-and-data-mining) | ||
## 你將在本課程中學到什麽 | ||
|
||
在本課程中,我們將僅涵蓋初學者必須了解的機器學習的核心概念。 我們主要使用 Scikit-learn 來介紹我們所謂的「經典機器學習」,這是一個許多學生用來學習基礎知識的優秀庫。要理解更廣泛的人工智能或深度學習的概念,機器學習的基礎知識是必不可少的,所以我們想在這裏提供它。 | ||
|
||
在本課程中,你將學習: | ||
|
||
- 機器學習的核心概念 | ||
- 機器學習的歷史 | ||
- 機器學習和公平性 | ||
- 回歸 | ||
- 分類 | ||
- 聚類 | ||
- 自然語言處理 | ||
- 時序預測 | ||
- 強化學習 | ||
- 機器學習的實際應用 | ||
## 我們不會涵蓋的內容 | ||
|
||
- 深度學習 | ||
- 神經網絡 | ||
- AI | ||
|
||
為了獲得更好的學習體驗,我們將避免神經網絡、「深度學習」(使用神經網絡的多層模型構建)和人工智能的復雜性,我們將在不同的課程中討論這些問題。 我們還將提供即將推出的數據科學課程,以專註於這個更大領域的這一方面。 | ||
## 為什麽要學習機器學習? | ||
|
||
從系統的角度來看,機器學習被定義為創建可以從數據中學習隱藏模式以幫助做出智能決策的自動化系統。 | ||
|
||
這種動機大致是受人腦如何根據它從外部世界感知到的數據來學習某些東西的啟發。 | ||
|
||
✅ 想一想為什麽企業想要嘗試使用機器學習策略而不是創建基於硬編碼的規則引擎。 | ||
|
||
### 機器學習的應用 | ||
|
||
機器學習的應用現在幾乎無處不在,就像我們的智能手機、互聯設備和其他系統產生的數據一樣無處不在。考慮到最先進的機器學習算法的巨大潛力,研究人員一直在探索其解決多維多學科現實問題的能力,並取得了巨大的積極成果。 | ||
|
||
**你可以在很多方面使用機器學習**: | ||
|
||
- 根據病人的病史或報告來預測患病的可能性。 | ||
- 利用天氣數據預測天氣。 | ||
- 理解文本的情感。 | ||
- 檢測假新聞以阻止其傳播。 | ||
|
||
金融、經濟學、地球科學、太空探索、生物醫學工程、認知科學,甚至人文學科領域都采用機器學習來解決其領域中艱巨的、數據處理繁重的問題。 | ||
|
||
機器學習通過從真實世界或生成的數據中發現有意義的見解,自動化了模式發現的過程。事實證明,它在商業、健康和金融應用等方面具有很高的價值。 | ||
|
||
在不久的將來,由於機器學習的廣泛應用,了解機器學習的基礎知識將成為任何領域的人們的必修課。 | ||
|
||
--- | ||
## 🚀 挑戰 | ||
|
||
在紙上或使用 [Excalidraw](https://excalidraw.com/) 等在線應用程序繪製草圖,了解你對 AI、ML、深度學習和數據科學之間差異的理解。添加一些關於這些技術擅長解決的問題的想法。 | ||
|
||
## [閱讀後測驗](https://white-water-09ec41f0f.azurestaticapps.net/quiz/2/) | ||
|
||
## 復習與自學 | ||
|
||
要了解有關如何在雲中使用 ML 算法的更多信息,請遵循以下[學習路徑](https://docs.microsoft.com/learn/paths/create-no-code-predictive-models-azure-machine-learning/?WT.mc_id=academic-15963-cxa)。 | ||
|
||
## 任務 | ||
|
||
[啟動並運行](assignment.zh-tw.md) |
9 changes: 9 additions & 0 deletions
9
1-Introduction/1-intro-to-ML/translations/assignment.zh-tw.md
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,9 @@ | ||
# 啟動和運行 | ||
|
||
## 說明 | ||
|
||
在這個不評分的作業中,你應該溫習一下 Python,將 Python 環境能夠運行起來,並且可以運行 notebooks。 | ||
|
||
學習這個 [Python 學習路徑](https://docs.microsoft.com/learn/paths/python-language/?WT.mc_id=academic-15963-cxa),然後通過這些介紹性的視頻將你的系統環境設置好: | ||
|
||
https://www.youtube.com/playlist?list=PLlrxD0HtieHhS8VzuMCfQD4uJ9yne1mE6 |
110 changes: 110 additions & 0 deletions
110
1-Introduction/2-history-of-ML/translations/README.zh-tw.md
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,110 @@ | ||
# 機器學習的歷史 | ||
|
||
 | ||
> 作者 [Tomomi Imura](https://www.twitter.com/girlie_mac) | ||
## [課前測驗](https://white-water-09ec41f0f.azurestaticapps.net/quiz/3/) | ||
|
||
在本課中,我們將走過機器學習和人工智能歷史上的主要裏程碑。 | ||
|
||
人工智能(AI)作為一個領域的歷史與機器學習的歷史交織在一起,因為支持機器學習的算法和計算能力的進步推動了AI的發展。記住,雖然這些領域作為不同研究領域在 20 世紀 50 年代才開始具體化,但重要的[算法、統計、數學、計算和技術發現](https://wikipedia.org/wiki/Timeline_of_machine_learning) 要早於和重疊了這個時代。 事實上,[數百年來](https://wikipedia.org/wiki/History_of_artificial_intelligence)人們一直在思考這些問題:本文討論了「思維機器」這一概念的歷史知識基礎。 | ||
|
||
## 主要發現 | ||
|
||
- 1763, 1812 [貝葉斯定理](https://wikipedia.org/wiki/Bayes%27_theorem) 及其前身。該定理及其應用是推理的基礎,描述了基於先驗知識的事件發生的概率。 | ||
- 1805 [最小二乘理論](https://wikipedia.org/wiki/Least_squares)由法國數學家 Adrien-Marie Legendre 提出。 你將在我們的回歸單元中了解這一理論,它有助於數據擬合。 | ||
- 1913 [馬爾可夫鏈](https://wikipedia.org/wiki/Markov_chain)以俄羅斯數學家 Andrey Markov 的名字命名,用於描述基於先前狀態的一系列可能事件。 | ||
- 1957 [感知器](https://wikipedia.org/wiki/Perceptron)是美國心理學家 Frank Rosenblatt 發明的一種線性分類器,是深度學習發展的基礎。 | ||
- 1967 [最近鄰](https://wikipedia.org/wiki/Nearest_neighbor)是一種最初設計用於映射路線的算法。 在 ML 中,它用於檢測模式。 | ||
- 1970 [反向傳播](https://wikipedia.org/wiki/Backpropagation)用於訓練[前饋神經網絡](https://wikipedia.org/wiki/Feedforward_neural_network)。 | ||
- 1982 [循環神經網絡](https://wikipedia.org/wiki/Recurrent_neural_network) 是源自產生時間圖的前饋神經網絡的人工神經網絡。 | ||
|
||
✅ 做點調查。在 ML 和 AI 的歷史上,還有哪些日期是重要的? | ||
## 1950: 會思考的機器 | ||
|
||
Alan Turing,一個真正傑出的人,[在 2019 年被公眾投票選出](https://wikipedia.org/wiki/Icons:_The_Greatest_Person_of_the_20th_Century) 作為 20 世紀最偉大的科學家,他認為有助於為「會思考的機器」的概念打下基礎。他通過創建 [圖靈測試](https://www.bbc.com/news/technology-18475646)來解決反對者和他自己對這一概念的經驗證據的需求,你將在我們的 NLP 課程中進行探索。 | ||
|
||
## 1956: 達特茅斯夏季研究項目 | ||
|
||
「達特茅斯夏季人工智能研究項目是人工智能領域的一個開創性事件,」正是在這裏,人們創造了「人工智能」一詞([來源](https://250.dartmouth.edu/highlights/artificial-intelligence-ai-coined-dartmouth))。 | ||
|
||
> 原則上,學習的每個方面或智能的任何其他特征都可以被精確地描述,以至於可以用機器來模擬它。 | ||
首席研究員、數學教授 John McCarthy 希望「基於這樣一種猜想,即學習的每個方面或智能的任何其他特征原則上都可以如此精確地描述,以至於可以製造出一臺機器來模擬它。」 參與者包括該領域的另一位傑出人物 Marvin Minsky。 | ||
|
||
研討會被認為發起並鼓勵了一些討論,包括「符號方法的興起、專註於有限領域的系統(早期專家系統),以及演繹系統與歸納系統的對比。」([來源](https://wikipedia.org/wiki/Dartmouth_workshop))。 | ||
|
||
## 1956 - 1974: 「黃金歲月」 | ||
|
||
從 20 世紀 50 年代到 70 年代中期,樂觀情緒高漲,希望人工智能能夠解決許多問題。1967 年,Marvin Minsky 自信地說,「一代人之內...創造『人工智能』的問題將得到實質性的解決。」(Minsky,Marvin(1967),《計算:有限和無限機器》,新澤西州恩格伍德克利夫斯:Prentice Hall) | ||
|
||
自然語言處理研究蓬勃發展,搜索被提煉並變得更加強大,創造了「微觀世界」的概念,在這個概念中,簡單的任務是用簡單的語言指令完成的。 | ||
|
||
這項研究得到了政府機構的充分資助,在計算和算法方面取得了進展,並建造了智能機器的原型。其中一些機器包括: | ||
|
||
* [機器人 Shakey](https://wikipedia.org/wiki/Shakey_the_robot),他們可以「聰明地」操縱和決定如何執行任務。 | ||
|
||
 | ||
> 1972 年的 Shakey | ||
* Eliza,一個早期的「聊天機器人」,可以與人交談並充當原始的「治療師」。 你將在 NLP 課程中了解有關 Eliza 的更多信息。 | ||
|
||
 | ||
> Eliza 的一個版本,一個聊天機器人 | ||
* 「積木世界」是一個微觀世界的例子,在那裏積木可以堆疊和分類,並且可以測試教機器做出決策的實驗。 使用 [SHRDLU](https://wikipedia.org/wiki/SHRDLU) 等庫構建的高級功能有助於推動語言處理向前發展。 | ||
|
||
[](https://www.youtube.com/watch?v=QAJz4YKUwqw "積木世界與SHRDLU") | ||
|
||
> 🎥 點擊上圖觀看視頻: 積木世界與 SHRDLU | ||
## 1974 - 1980: AI 的寒冬 | ||
|
||
到了 20 世紀 70 年代中期,很明顯製造「智能機器」的復雜性被低估了,而且考慮到可用的計算能力,它的前景被誇大了。資金枯竭,市場信心放緩。影響信心的一些問題包括: | ||
|
||
- **限製**。計算能力太有限了 | ||
- **組合爆炸**。隨著對計算機的要求越來越高,需要訓練的參數數量呈指數級增長,而計算能力卻沒有平行發展。 | ||
- **缺乏數據**。 缺乏數據阻礙了測試、開發和改進算法的過程。 | ||
- **我們是否在問正確的問題?**。 被問到的問題也開始受到質疑。 研究人員開始對他們的方法提出批評: | ||
- 圖靈測試受到質疑的方法之一是「中國房間理論」,該理論認為,「對數字計算機進行編程可能使其看起來能理解語言,但不能產生真正的理解。」 ([來源](https://plato.stanford.edu/entries/chinese-room/)) | ||
- 將「治療師」ELIZA 這樣的人工智能引入社會的倫理受到了挑戰。 | ||
|
||
與此同時,各種人工智能學派開始形成。 在 [「scruffy」 與 「neat AI」](https://wikipedia.org/wiki/Neats_and_scruffies) 之間建立了二分法。 _Scruffy_ 實驗室對程序進行了數小時的調整,直到獲得所需的結果。 _Neat_ 實驗室「專註於邏輯和形式問題的解決」。 ELIZA 和 SHRDLU 是眾所周知的 _scruffy_ 系統。 在 1980 年代,隨著使 ML 系統可重現的需求出現,_neat_ 方法逐漸走上前沿,因為其結果更易於解釋。 | ||
|
||
## 1980s 專家系統 | ||
|
||
隨著這個領域的發展,它對商業的好處變得越來越明顯,在 20 世紀 80 年代,『專家系統』也開始廣泛流行起來。「專家系統是首批真正成功的人工智能 (AI) 軟件形式之一。」 ([來源](https://wikipedia.org/wiki/Expert_system))。 | ||
|
||
這種類型的系統實際上是混合系統,部分由定義業務需求的規則引擎和利用規則系統推斷新事實的推理引擎組成。 | ||
|
||
在這個時代,神經網絡也越來越受到重視。 | ||
|
||
## 1987 - 1993: AI 的冷靜期 | ||
|
||
專業的專家系統硬件的激增造成了過於專業化的不幸後果。個人電腦的興起也與這些大型、專業化、集中化系統展開了競爭。計算機的平民化已經開始,它最終為大數據的現代爆炸鋪平了道路。 | ||
|
||
## 1993 - 2011 | ||
|
||
這個時代見證了一個新的時代,ML 和 AI 能夠解決早期由於缺乏數據和計算能力而導致的一些問題。數據量開始迅速增加,變得越來越廣泛,無論好壞,尤其是 2007 年左右智能手機的出現,計算能力呈指數級增長,算法也隨之發展。這個領域開始變得成熟,因為過去那些隨心所欲的日子開始具體化為一種真正的紀律。 | ||
|
||
## 現在 | ||
|
||
今天,機器學習和人工智能幾乎觸及我們生活的每一個部分。這個時代要求仔細了解這些算法對人類生活的風險和潛在影響。正如微軟的 Brad Smith 所言,「信息技術引發的問題觸及隱私和言論自由等基本人權保護的核心。這些問題加重了製造這些產品的科技公司的責任。在我們看來,它們還呼籲政府進行深思熟慮的監管,並圍繞可接受的用途製定規範」([來源](https://www.technologyreview.com/2019/12/18/102365/the-future-of-ais-impact-on-society/))。 | ||
|
||
未來的情況還有待觀察,但了解這些計算機系統以及它們運行的軟件和算法是很重要的。我們希望這門課程能幫助你更好的理解,以便你自己決定。 | ||
|
||
[](https://www.youtube.com/watch?v=mTtDfKgLm54 "深度學習的歷史") | ||
> 🎥 點擊上圖觀看視頻:Yann LeCun 在本次講座中討論深度學習的歷史 | ||
--- | ||
## 🚀挑戰 | ||
|
||
深入了解這些歷史時刻之一,並更多地了解它們背後的人。這裏有許多引人入勝的人物,沒有一項科學發現是在文化真空中創造出來的。你發現了什麽? | ||
|
||
## [課後測驗](https://white-water-09ec41f0f.azurestaticapps.net/quiz/4/) | ||
|
||
## 復習與自學 | ||
|
||
以下是要觀看和收聽的節目: | ||
|
||
[這是 Amy Boyd 討論人工智能進化的播客](http://runasradio.com/Shows/Show/739) | ||
|
||
[](https://www.youtube.com/watch?v=EJt3_bFYKss "Amy Boyd的《人工智能史》") | ||
|
||
## 任務 | ||
|
||
[創建時間線](assignment.zh-tw.md) |
12 changes: 12 additions & 0 deletions
12
1-Introduction/2-history-of-ML/translations/assignment.zh-tw.md
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,12 @@ | ||
|
||
# 建立一個時間軸 | ||
|
||
## 說明 | ||
|
||
使用這個 [倉庫](https://github.com/Digital-Humanities-Toolkit/timeline-builder),創建一個關於算法、數學、統計學、人工智能、機器學習的某個方面或者可以綜合多個以上學科來講。你可以著重介紹某個人,某個想法,或者一個經久不衰的思想。請確保添加了多媒體元素在你的時間線中。 | ||
|
||
## 評判標準 | ||
|
||
| 標準 | 優秀 | 中規中矩 | 仍需努力 | | ||
| ------------ | ---------------------------------- | ---------------------- | ------------------------------------------ | | ||
| | 有一個用 GitHub page 展示的 timeline | 代碼還不完整並且沒有部署 | 時間線不完整,沒有經過充分的研究,並且沒有部署 | |
Oops, something went wrong.