Skip to content

Commit

Permalink
Merge pull request apachecn#492 from jiangzhonglian/dev
Browse files Browse the repository at this point in the history
 更新排版信息和添加一些信息
  • Loading branch information
jiangzhonglian authored Mar 25, 2019
2 parents e7e68f7 + 5e9a22a commit 31462e0
Show file tree
Hide file tree
Showing 5 changed files with 103 additions and 102 deletions.
199 changes: 99 additions & 100 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -2,17 +2,12 @@
<a href="https://www.apachecn.org">
<img width="200" src="http://data.apachecn.org/img/logo/GreenHat.jpg">
</a>
<br >
<a href="https://www.apachecn.org/"><img src="https://img.shields.io/badge/%3E-HOME-green.svg"></a>
<a href="http://home.apachecn.org/about/"><img src="https://img.shields.io/badge/%3E-ABOUT-green.svg"></a>
<a href="mailto:apache@163.com"><img src="https://img.shields.io/badge/%3E-Email-green.svg"></a>
</p>

> ApacheCN 中文开源组织
* 首页地址: <http://www.apachecn.org>
* 关于我们: <http://www.apachecn.org/about>
* 我们不是 Apache 的官方组织/机构/团体,只是 Apache 技术栈(以及 AI)的爱好者!
* 合作or侵权,请联系: apachecn@163.com

> **欢迎任何人参与和完善:一个人可以走的很快,但是一群人却可以走的更远**
<h2 align="center">Special Sponsors</h2>
<table>
<tbody>
Expand All @@ -25,17 +20,27 @@
</tbody>
</table>

# AI Learning
> ApacheCN 中文开源组织
* 我们不是 Apache 的官方组织/机构/团体,只是 Apache 技术栈(以及 AI)的爱好者!
* 合作or侵权,请联系: apachecn@163.com
* **ApacheCN - 学习机器学习群【629470233】<a target="_blank" href="//shang.qq.com/wpa/qunwpa?idkey=30e5f1123a79867570f665aa3a483ca404b1c3f77737bc01ec520ed5f078ddef"><img border="0" src="img/MainPage/ApacheCN-group.png" alt="ApacheCN - 学习机器学习群[629470233]" title="ApacheCN - 学习机器学习群[629470233]"></a>**

> **欢迎任何人参与和完善:一个人可以走的很快,但是一群人却可以走的更远**
# AI learning

按照步骤: 1 => 2 => 3,你可以当大牛!

## 1.机器学习 - 基础

* **Machine Learning in Action (机器学习实战) | [ApacheCN(apache中文网)](http://cwiki.apachecn.org/)**
* 电子版书籍:[【机器学习实战-中文版-带目录版.pdf】](https://github.com/apachecn/AiLearning/tree/master/books)
* 电子版书籍:[【机器学习实战-中文版-带目录版.pdf】](https://github.com/apachecn/AiLearning/tree/master/books)
* -- 感谢 [飞龙小哥哥](https://github.com/wizardforcel) 生成的电子书[《机器学习实战-ApacheCN.pdf》](https://github.com/apachecn/AiLearning/blob/master/books/机器学习实战-ApacheCN.pdf)
* **视频已更新完成,如果你觉得有价值,请帮忙点 Star【后续组织学习活动:sklearn、kaggle、 Pytorch 和 tensorflow】**
* -- 视频网站:优酷 /bilibili / Acfun / 网易云课堂,可直接在线播放。(最下方有相应链接)
* -- [群小哥哥:红色石头](https://github.com/RedstoneWill): [台湾大学林轩田机器学习笔记](https://github.com/apachecn/ntu-hsuantienlin-ml)
* 推荐一个[机器学习笔记](https://feisky.xyz/machine-learning): https://feisky.xyz/machine-learning
* 推荐一个[liuhuanyong大佬](https://github.com/liuhuanyong)整理的nlp全面知识体系: <https://liuhuanyong.github.io>

<table>
<tr>
Expand Down Expand Up @@ -166,35 +171,66 @@
</tr>
</table>

# 深度学习 DeepLearning

* 1.) [入门介绍](/blog/dl/1.入门介绍.md)
* 2.) 代码位置:src/py2.x or py3.x/DL
### 网站视频

# 自然语言处理 NLP 学习
> [知乎问答-爆炸啦-机器学习该怎么入门?](https://www.zhihu.com/question/20691338/answer/248678328)
## 1.使用场景 (百度公开课)
当然我知道,第一句就会被吐槽,因为科班出身的人,不屑的吐了一口唾沫,说傻X,还评论 Andrew Ng 的视频。。

> 第一部分 入门介绍
我还知道还有一部分人,看 Andrew Ng 的视频就是看不懂,那神秘的数学推导,那迷之微笑的英文版的教学,我何尝又不是这样走过来的?? 我的心可能比你们都痛,因为我在网上收藏过上10部《机器学习》相关视频,外加国内本土风格的教程:7月+小象 等等,我都很难去听懂,直到有一天,被一个百度的高级算法分析师推荐说:《机器学习实战》还不错,通俗易懂,你去试试??

* 1.) [自然语言处理入门介绍](/blog/nlp/1.自然语言处理入门介绍.md)
我试了试,还好我的Python基础和调试能力还不错,基本上代码都调试过一遍,很多高大上的 "理论+推导",在我眼中变成了几个 "加减乘除+循环",我想这不就是像我这样的程序员想要的入门教程么?

> 第二部分 机器翻译
很多程序员说机器学习 TM 太难学了,是的,真 TM 难学,我想最难的是:没有一本像《机器学习实战》那样的作者愿意以程序员 Coding 角度去给大家讲解!!

* 2.) [机器翻译](/blog/nlp/2.机器翻译.md)
最近几天,GitHub 涨了 300颗 star,加群的200人, 现在还在不断的增加++,我想大家可能都是感同身受吧!

> 第三部分 篇章分析
很多想入门新手就是被忽悠着收藏收藏再收藏,但是最后还是什么都没有学到,也就是"资源收藏家",也许新手要的就是 [MachineLearning(机器学习) 学习路线图](http://www.apachecn.org/map/145.html)。没错,我可以给你们的一份,因为我们还通过视频记录下来我们的学习过程。水平当然也有限,不过对于新手入门,绝对没问题,如果你还不会,那算我输!!

* 3.1.) [篇章分析-内容概述](/blog/nlp/3.1.篇章分析-内容概述.md)
* 3.2.) [篇章分析-内容标签](/blog/nlp/3.2.篇章分析-内容标签.md)
* 3.3.) [篇章分析-情感分析](/blog/nlp/3.3.篇章分析-情感分析.md)
* 3.4.) [篇章分析-自动摘要](/blog/nlp/3.4.篇章分析-自动摘要.md)
> 视频怎么看?
> 第四部分 UNIT-语言理解与交互技术
![](img/MainPage/ApacheCN-ML-bilibili-compare.jpg)

* 4.) [UNIT-语言理解与交互技术](/blog/nlp/4.UNIT-语言理解与交互技术.md)
1. 理论科班出身-建议去学习 Andrew Ng 的视频(Ng 的视频绝对是权威,这个毋庸置疑)
2. 编码能力强 - 建议看我们的[《机器学习实战-教学版》](https://space.bilibili.com/97678687/#!/channel/detail?cid=22486)
3. 编码能力弱 - 建议看我们的[《机器学习实战-讨论版》](https://space.bilibili.com/97678687/#!/channel/detail?cid=13045),不过在看理论的时候,看 教学版-理论部分;讨论版的废话太多,不过在讲解代码的时候是一行一行讲解的;所以,根据自己的需求,自由的组合。

> 【免费】数学教学视频 - 可汗学院 入门篇
* [@于振梓]() 推荐: 可汗学院-网易公开课

| 概率 | 统计 | 线性代数 |
| - | - | - |
| [可汗学院(概率)](http://open.163.com/special/Khan/probability.html) | [可汗学院(统计学)](http://open.163.com/special/Khan/khstatistics.html)| [可汗学院(线性代数)](http://open.163.com/special/Khan/linearalgebra.html)

> 机器学习视频 - ApacheCN 教学版
|||
| - | - |
| AcFun | B站 |
| <a title="AcFun(机器学习视频)" href="http://www.acfun.cn/u/12540256.aspx#page=1" target="_blank"><img width="290" src="img/MainPage/ApacheCN-ML-AcFun.jpg"></a> | <a title="bilibili(机器学习视频)" href="https://space.bilibili.com/97678687/#!/channel/index" target="_blank"><img width="290" src="img/MainPage/ApacheCN-ML-bilibili.jpg"></a> |
| 优酷 | 网易云课堂 |
| <a title="YouKu(机器学习视频)" href="http://i.youku.com/apachecn" target="_blank"><img width="290" src="img/MainPage/ApacheCM-ML-youku.jpg"></a> | <a title="WangYiYunKeTang(机器学习视频)" href="http://study.163.com/course/courseMain.htm?courseId=1004582003" target="_blank"><img width="290" src="img/MainPage/ApacheCM-ML-WangYiYunKeTang.png"></a> |

> 【免费】机器/深度学习视频 - 吴恩达
| 机器学习 | 深度学习 |
| - | - |
| [吴恩达机器学习](http://study.163.com/course/courseMain.htm?courseId=1004570029) | [神经网络和深度学习](http://mooc.study.163.com/course/2001281002?tid=2001392029) |

## 2.相关结构

## 2.深度学习 - 基础

> 深度学习必学
1. 反向传递: https://www.cnblogs.com/charlotte77/p/5629865.html
2. CNN原理: http://www.cnblogs.com/charlotte77/p/7759802.html
3. RNN原理: https://blog.csdn.net/qq_39422642/article/details/78676567
4. LSTM深入浅出的好文: https://blog.csdn.net/roslei/article/details/61912618


## 3.自然语言处理

学习过程中-内心复杂的变化!!!

Expand All @@ -217,16 +253,40 @@

![](img/nlp/F94581F64C21A1094A473397DFA42F9C.jpg)

* 入门教程需看资料【添加比赛链接】: https://github.com/apachecn/AiLearning/tree/dev/blog/nlp
* **入门教程必看资料【添加比赛链接】: https://github.com/apachecn/AiLearning/tree/dev/blog/nlp**
* Python 自然语言处理 第二版: https://usyiyi.github.io/nlp-py-2e-zh
* 推荐一个[liuhuanyong大佬](https://github.com/liuhuanyong)整理的nlp全面知识体系: <https://liuhuanyong.github.io>

### 1.使用场景 (百度公开课)

> 第一部分 入门介绍
### 中文分词:
* 1.) [自然语言处理入门介绍](/blog/nlp/1.自然语言处理入门介绍.md)

> 第二部分 机器翻译
* 2.) [机器翻译](/blog/nlp/2.机器翻译.md)

> 第三部分 篇章分析
* 3.1.) [篇章分析-内容概述](/blog/nlp/3.1.篇章分析-内容概述.md)
* 3.2.) [篇章分析-内容标签](/blog/nlp/3.2.篇章分析-内容标签.md)
* 3.3.) [篇章分析-情感分析](/blog/nlp/3.3.篇章分析-情感分析.md)
* 3.4.) [篇章分析-自动摘要](/blog/nlp/3.4.篇章分析-自动摘要.md)

> 第四部分 UNIT-语言理解与交互技术
* 4.) [UNIT-语言理解与交互技术](/blog/nlp/4.UNIT-语言理解与交互技术.md)

### 应用领域

#### 中文分词:

* 构建DAG图
* 动态规划查找,综合正反向(正向加权反向输出)求得DAG最大概率路径
* 使用了SBME语料训练了一套 HMM + Viterbi 模型,解决未登录词问题

### 1.文本分类(Text Classification)
#### 1.文本分类(Text Classification)

文本分类是指标记句子或文档,例如电子邮件垃圾邮件分类和情感分析。

Expand All @@ -252,7 +312,7 @@

**通过AUC 来评估模型的效果**

### 2.语言模型(Language Modeling)
#### 2.语言模型(Language Modeling)

语言建模涉及开发一种统计模型,用于预测句子中的下一个单词或一个单词中的下一个单词。它是语音识别和机器翻译等任务中的前置任务。

Expand Down Expand Up @@ -280,7 +340,7 @@
* bi-gram + levenshtein

### 3.图像字幕(Image Captioning)
#### 3.图像字幕(Image Captioning)

mage字幕是为给定图像生成文本描述的任务。

Expand All @@ -293,7 +353,7 @@ mage字幕是为给定图像生成文本描述的任务。

[探索图像字幕数据集,2016年](http://sidgan.me/technical/2016/01/09/Exploring-Datasets)

### 4.机器翻译(Machine Translation)
#### 4.机器翻译(Machine Translation)

机器翻译是将文本从一种语言翻译成另一种语言的任务。

Expand All @@ -310,7 +370,7 @@ mage字幕是为给定图像生成文本描述的任务。
* Encoder + Decoder(Attention)
* 参考案例: http://pytorch.apachecn.org/cn/tutorials/intermediate/seq2seq_translation_tutorial.html

### 5.问答系统(Question Answering)
#### 5.问答系统(Question Answering)

问答是一项任务,其中提供了一个句子或文本样本,从中提出问题并且必须回答问题。

Expand All @@ -323,7 +383,7 @@ mage字幕是为给定图像生成文本描述的任务。

[数据集:我如何获得问答网站的语料库,如Quora或Yahoo Answers或Stack Overflow来分析答案质量?](https://www.quora.com/Datasets-How-can-I-get-corpus-of-a-question-answering-website-like-Quora-or-Yahoo-Answers-or-Stack-Overflow-for-analyzing-answer-quality)

### 6.语音识别(Speech Recognition)
#### 6.语音识别(Speech Recognition)

语音识别是将口语的音频转换为人类可读文本的任务。

Expand All @@ -333,7 +393,7 @@ mage字幕是为给定图像生成文本描述的任务。
2. [VoxForge](http://voxforge.org/)。用于构建用于语音识别的开源数据库的项目。
3. [LibriSpeech ASR语料库](http://www.openslr.org/12/)。从LibriVox收集的大量英语有声读物。

### 7.自动文摘(Document Summarization)
#### 7.自动文摘(Document Summarization)

文档摘要是创建较大文档的简短有意义描述的任务。

Expand All @@ -360,6 +420,7 @@ mage字幕是为给定图像生成文本描述的任务。
* word2vec推荐文档: https://www.zhihu.com/question/44832436/answer/266068967
* textrank推荐文档: https://blog.csdn.net/BaiHuaXiu123/article/details/77847232


## Graph图计算【慢慢更新】

* 数据集: [data/nlp/graph](data/nlp/graph)
Expand All @@ -378,57 +439,6 @@ mage字幕是为给定图像生成文本描述的任务。
7. [NLP数据集](https://github.com/caesar0301/awesome-public-datasets#natural-language)
8. 国内开放数据集: https://bosonnlp.com/dev/resource

## 网站视频

> [知乎问答-爆炸啦-机器学习该怎么入门?](https://www.zhihu.com/question/20691338/answer/248678328)
当然我知道,第一句就会被吐槽,因为科班出身的人,不屑的吐了一口唾沫,说傻X,还评论 Andrew Ng 的视频。。

我还知道还有一部分人,看 Andrew Ng 的视频就是看不懂,那神秘的数学推导,那迷之微笑的英文版的教学,我何尝又不是这样走过来的?? 我的心可能比你们都痛,因为我在网上收藏过上10部《机器学习》相关视频,外加国内本土风格的教程:7月+小象 等等,我都很难去听懂,直到有一天,被一个百度的高级算法分析师推荐说:《机器学习实战》还不错,通俗易懂,你去试试??

我试了试,还好我的Python基础和调试能力还不错,基本上代码都调试过一遍,很多高大上的 "理论+推导",在我眼中变成了几个 "加减乘除+循环",我想这不就是像我这样的程序员想要的入门教程么?

很多程序员说机器学习 TM 太难学了,是的,真 TM 难学,我想最难的是:没有一本像《机器学习实战》那样的作者愿意以程序员 Coding 角度去给大家讲解!!

最近几天,GitHub 涨了 300颗 star,加群的200人, 现在还在不断的增加++,我想大家可能都是感同身受吧!

很多想入门新手就是被忽悠着收藏收藏再收藏,但是最后还是什么都没有学到,也就是"资源收藏家",也许新手要的就是 [MachineLearning(机器学习) 学习路线图](http://www.apachecn.org/map/145.html)。没错,我可以给你们的一份,因为我们还通过视频记录下来我们的学习过程。水平当然也有限,不过对于新手入门,绝对没问题,如果你还不会,那算我输!!

> 视频怎么看?
![](img/MainPage/ApacheCN-ML-bilibili-compare.jpg)

1. 理论科班出身-建议去学习 Andrew Ng 的视频(Ng 的视频绝对是权威,这个毋庸置疑)
2. 编码能力强 - 建议看我们的[《机器学习实战-教学版》](https://space.bilibili.com/97678687/#!/channel/detail?cid=22486)
3. 编码能力弱 - 建议看我们的[《机器学习实战-讨论版》](https://space.bilibili.com/97678687/#!/channel/detail?cid=13045),不过在看理论的时候,看 教学版-理论部分;讨论版的废话太多,不过在讲解代码的时候是一行一行讲解的;所以,根据自己的需求,自由的组合。

循序渐进大体介绍:[机器学习初学者建议 | ApacheCN](http://www.apachecn.org/map/179.html)

干货内容实际操作:[MachineLearning(机器学习) 学习路线图](http://www.apachecn.org/map/145.html)

> 【免费】数学教学视频 - 可汗学院 入门篇
* [@于振梓]() 推荐: 可汗学院-网易公开课

| 概率 | 统计 | 线性代数 |
| - | - | - |
| [可汗学院(概率)](http://open.163.com/special/Khan/probability.html) | [可汗学院(统计学)](http://open.163.com/special/Khan/khstatistics.html)| [可汗学院(线性代数)](http://open.163.com/special/Khan/linearalgebra.html)

> 机器学习视频 - ApacheCN 教学版
|||
| - | - |
| AcFun | B站 |
| <a title="AcFun(机器学习视频)" href="http://www.acfun.cn/u/12540256.aspx#page=1" target="_blank"><img width="290" src="img/MainPage/ApacheCN-ML-AcFun.jpg"></a> | <a title="bilibili(机器学习视频)" href="https://space.bilibili.com/97678687/#!/channel/index" target="_blank"><img width="290" src="img/MainPage/ApacheCN-ML-bilibili.jpg"></a> |
| 优酷 | 网易云课堂 |
| <a title="YouKu(机器学习视频)" href="http://i.youku.com/apachecn" target="_blank"><img width="290" src="img/MainPage/ApacheCM-ML-youku.jpg"></a> | <a title="WangYiYunKeTang(机器学习视频)" href="http://study.163.com/course/courseMain.htm?courseId=1004582003" target="_blank"><img width="290" src="img/MainPage/ApacheCM-ML-WangYiYunKeTang.png"></a> |

> 【免费】机器/深度学习视频 - 吴恩达
| 机器学习 | 深度学习 |
| - | - |
| [吴恩达机器学习](http://study.163.com/course/courseMain.htm?courseId=1004570029) | [神经网络和深度学习](http://mooc.study.163.com/course/2001281002?tid=2001392029) |

## 项目负责人

> Ml 第一期 (2017-02-27)
Expand Down Expand Up @@ -524,11 +534,6 @@ mage字幕是为给定图像生成文本描述的任务。

**欢迎贡献者不断的追加**

> 加入方式
* 企鹅: 529815144(片刻) 1042658081(那伊抹微笑) 190442212(瑶妹)
* [ApacheCN(apache中文网) 维护更新](http://www.apachecn.org) : [关于我们](http://cwiki.apachecn.org/pages/viewpage.action?pageId=2887240) && [加入我们](http://cwiki.apachecn.org/pages/viewpage.action?pageId=2887239)

## 免责声明 - 【只供学习参考】

* ApacheCN 纯粹出于学习目的与个人兴趣翻译本书
Expand All @@ -551,9 +556,3 @@ mage字幕是为给定图像生成文本描述的任务。
以各项目协议为准。

ApacheCN 账号下没有协议的项目,一律视为 [CC BY-NC-SA 4.0](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.zh)

## Organization

* ApacheCN 组织资源: <https://github.com/apachecn/home>

> 欢迎任何人参与和完善:一个人可以走的很快,但是一群人却可以走的更远
Empty file added blog/contributor.md
Empty file.
Empty file added blog/ml/README.md
Empty file.
6 changes: 4 additions & 2 deletions blog/nlp/README.md
Original file line number Diff line number Diff line change
@@ -1,9 +1,10 @@
# 入门教程需看资料

## nlp 学习书籍
## nlp 学习书籍和工具

* 百度搜索:Python自然语言处理
* 读书笔记:https://wnma3mz.github.io/hexo_blog/2018/05/13/《Python自然语言处理》阅读笔记(一)
* Python自然语言处理工具汇总: <https://blog.csdn.net/sa14023053/article/details/51823122>

## nlp 全局介绍视频:(简单做了解就行)

Expand All @@ -13,7 +14,7 @@
2. 百度机器翻译
3. 篇章分析
4. UNIT:语言理解与交互技术

## 中文 nlp 词向量

https://github.com/Embedding/Chinese-Word-Vectors
Expand Down Expand Up @@ -73,6 +74,7 @@ https://github.com/Embedding/Chinese-Word-Vectors
+ 句子文本相似度计算
- https://www.kaggle.com/c/quora-question-pairs


* * *

【比赛收集平台】: https://github.com/iphysresearch/DataSciComp
File renamed without changes.

0 comments on commit 31462e0

Please sign in to comment.