Skip to content

Commit

Permalink
更新链接
Browse files Browse the repository at this point in the history
  • Loading branch information
jiangzhonglian committed Aug 24, 2018
1 parent 2f36f1d commit 1a54fb9
Show file tree
Hide file tree
Showing 358 changed files with 360 additions and 360 deletions.
40 changes: 20 additions & 20 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -4,10 +4,10 @@

> **欢迎任何人参与和完善:一个人可以走的很快,但是一群人却可以走的更远**
* **ApacheCN - 学习机器学习群【629470233】<a target="_blank" href="//shang.qq.com/wpa/qunwpa?idkey=30e5f1123a79867570f665aa3a483ca404b1c3f77737bc01ec520ed5f078ddef"><img border="0" src="/images/MainPage/ApacheCN-group.png" alt="ApacheCN - 学习机器学习群[629470233]" title="ApacheCN - 学习机器学习群[629470233]"></a>**
* **ApacheCN - 学习机器学习群【629470233】<a target="_blank" href="//shang.qq.com/wpa/qunwpa?idkey=30e5f1123a79867570f665aa3a483ca404b1c3f77737bc01ec520ed5f078ddef"><img border="0" src/img/MainPage/ApacheCN-group.png" alt="ApacheCN - 学习机器学习群[629470233]" title="ApacheCN - 学习机器学习群[629470233]"></a>**
* **Machine Learning in Action (机器学习实战) | [ApacheCN(apache中文网)](http://cwiki.apachecn.org/)**
* 电子版书籍:[【机器学习实战-中文版-带目录版.pdf】](https://github.com/apachecn/MachineLearning/tree/master/books)
* -- 感谢 [群小哥哥:Wizard Zhang](https://github.com/wizardforcel) 生成的电子书[《机器学习实战-ApacheCN.pdf》](https://github.com/apachecn/MachineLearning/blob/master/books/机器学习实战-ApacheCN.pdf)
* 电子版书籍:[【机器学习实战-中文版-带目录版.pdf】](https://github.com/apachecn/AiLearning/tree/master/books)
* -- 感谢 [群小哥哥:Wizard Zhang](https://github.com/wizardforcel) 生成的电子书[《机器学习实战-ApacheCN.pdf》](https://github.com/apachecn/AiLearning/blob/master/books/机器学习实战-ApacheCN.pdf)
* **视频已更新完成,如果你觉得有价值,请帮忙点 Star【后续组织学习活动:sklearn、kaggle、 Pytorch 和 tensorflow】**
* -- 视频网站:优酷 /bilibili / Acfun / 网易云课堂,可直接在线播放。(最下方有相应链接)
* -- [群小哥哥:红色石头的机器学习之路](https://github.com/RedstoneWill): [台湾大学林轩田机器学习基石课程 - **系列学习笔记**](https://mp.weixin.qq.com/s/xb0i55zIQVzCiSZALbvncg)
Expand All @@ -23,112 +23,112 @@
</tr>
<tr>
<td>机器学习实战</td>
<td><a href="/apachecn/MachineLearning/blob/master/docs/1.机器学习基础.md"> 第 1 章: 机器学习基础</a></td>
<td><a href="/apachecn/AiLearning/blob/master/docs/1.机器学习基础.md"> 第 1 章: 机器学习基础</a></td>
<td>介绍</td>
<td><a href="https://github.com/ElmaDavies">@毛红动</a></td>
<td>1306014226</td>
</tr>
<tr>
<td>机器学习实战</td>
<td><a href="/apachecn/MachineLearning/blob/master/docs/2.k-近邻算法.md">第 2 章: KNN 近邻算法</a></td>
<td><a href="/apachecn/AiLearning/blob/master/docs/2.k-近邻算法.md">第 2 章: KNN 近邻算法</a></td>
<td>分类</td>
<td><a href="https://github.com/youyj521">@尤永江</a></td>
<td>279393323</td>
</tr>
<tr>
<td>机器学习实战</td>
<td><a href="/apachecn/MachineLearning/blob/master/docs/3.决策树.md">第 3 章: 决策树</a></td>
<td><a href="/apachecn/AiLearning/blob/master/docs/3.决策树.md">第 3 章: 决策树</a></td>
<td>分类</td>
<td><a href="https://github.com/jingwangfei">@景涛</a></td>
<td>844300439</td>
</tr>
<tr>
<td>机器学习实战</td>
<td><a href="/apachecn/MachineLearning/blob/master/docs/4.朴素贝叶斯.md">第 4 章: 朴素贝叶斯</a></td>
<td><a href="/apachecn/AiLearning/blob/master/docs/4.朴素贝叶斯.md">第 4 章: 朴素贝叶斯</a></td>
<td>分类</td>
<td><a href="https://github.com/wnma3mz">@wnma3mz</a><br/><a href="https://github.com/kailian">@分析</a></td>
<td>1003324213<br/>244970749</td>
</tr>
<tr>
<td>机器学习实战</td>
<td><a href="/apachecn/MachineLearning/blob/master/docs/5.Logistic回归.md">第 5 章: Logistic回归</a></td>
<td><a href="/apachecn/AiLearning/blob/master/docs/5.Logistic回归.md">第 5 章: Logistic回归</a></td>
<td>分类</td>
<td><a href="https://github.com/DataMonk2017">@微光同尘</a></td>
<td>529925688</td>
</tr>
<tr>
<td>机器学习实战</td>
<td><a href="/apachecn/MachineLearning/blob/master/docs/6.支持向量机.md">第 6 章: SVM 支持向量机</a></td>
<td><a href="/apachecn/AiLearning/blob/master/docs/6.支持向量机.md">第 6 章: SVM 支持向量机</a></td>
<td>分类</td>
<td><a href="https://github.com/VPrincekin">@王德红</a></td>
<td>934969547</td>
</tr>
<tr>
<td>网上组合内容</td>
<td><a href="/apachecn/MachineLearning/blob/master/docs/7.集成方法-随机森林和AdaBoost.md">第 7 章: 集成方法(随机森林和 AdaBoost)</a></td>
<td><a href="/apachecn/AiLearning/blob/master/docs/7.集成方法-随机森林和AdaBoost.md">第 7 章: 集成方法(随机森林和 AdaBoost)</a></td>
<td>分类</td>
<td><a href="https://github.com/jiangzhonglian">@片刻</a></td>
<td>529815144</td>
</tr>
<tr>
<td>机器学习实战</td>
<td><a href="/apachecn/MachineLearning/blob/master/docs/8.回归.md">第 8 章: 回归</a></td>
<td><a href="/apachecn/AiLearning/blob/master/docs/8.回归.md">第 8 章: 回归</a></td>
<td>回归</td>
<td><a href="https://github.com/DataMonk2017">@微光同尘</a></td>
<td>529925688</td>
</tr>
<tr>
<td>机器学习实战</td>
<td><a href="/apachecn/MachineLearning/blob/master/docs/9.树回归.md">第 9 章: 树回归</a></td>
<td><a href="/apachecn/AiLearning/blob/master/docs/9.树回归.md">第 9 章: 树回归</a></td>
<td>回归</td>
<td><a href="https://github.com/DataMonk2017">@微光同尘</a></td>
<td>529925688</td>
</tr>
<tr>
<td>机器学习实战</td>
<td><a href="/apachecn/MachineLearning/blob/master/docs/10.k-means聚类.md">第 10 章: K-Means 聚类</a></td>
<td><a href="/apachecn/AiLearning/blob/master/docs/10.k-means聚类.md">第 10 章: K-Means 聚类</a></td>
<td>聚类</td>
<td><a href="https://github.com/xuzhaoqing">@徐昭清</a></td>
<td>827106588</td>
</tr>
<tr>
<td>机器学习实战</td>
<td><a href="/apachecn/MachineLearning/blob/master/docs/11.使用Apriori算法进行关联分析.md">第 11 章: 利用 Apriori 算法进行关联分析</a></td>
<td><a href="/apachecn/AiLearning/blob/master/docs/11.使用Apriori算法进行关联分析.md">第 11 章: 利用 Apriori 算法进行关联分析</a></td>
<td>频繁项集</td>
<td><a href="https://github.com/WindZQ">@刘海飞</a></td>
<td>1049498972</td>
</tr>
<tr>
<td>机器学习实战</td>
<td><a href="/apachecn/MachineLearning/blob/master/docs/12.使用FP-growth算法来高效发现频繁项集.md">第 12 章: FP-growth 高效发现频繁项集</a></td>
<td><a href="/apachecn/AiLearning/blob/master/docs/12.使用FP-growth算法来高效发现频繁项集.md">第 12 章: FP-growth 高效发现频繁项集</a></td>
<td>频繁项集</td>
<td><a href="https://github.com/mikechengwei">@程威</a></td>
<td>842725815</td>
</tr>
<tr>
<td>机器学习实战</td>
<td><a href="/apachecn/MachineLearning/blob/master/docs/13.利用PCA来简化数据.md">第 13 章: 利用 PCA 来简化数据</a></td>
<td><a href="/apachecn/AiLearning/blob/master/docs/13.利用PCA来简化数据.md">第 13 章: 利用 PCA 来简化数据</a></td>
<td>工具</td>
<td><a href="https://github.com/lljuan330">@廖立娟</a></td>
<td>835670618</td>
</tr>
<tr>
<td>机器学习实战</td>
<td><a href="/apachecn/MachineLearning/blob/master/docs/14.利用SVD简化数据.md">第 14 章: 利用 SVD 来简化数据</a></td>
<td><a href="/apachecn/AiLearning/blob/master/docs/14.利用SVD简化数据.md">第 14 章: 利用 SVD 来简化数据</a></td>
<td>工具</td>
<td><a href="https://github.com/marsjhao">@张俊皓</a></td>
<td>714974242</td>
</tr>
<tr>
<td>机器学习实战</td>
<td><a href="/apachecn/MachineLearning/blob/master/docs/15.大数据与MapReduce.md">第 15 章: 大数据与 MapReduce</a></td>
<td><a href="/apachecn/AiLearning/blob/master/docs/15.大数据与MapReduce.md">第 15 章: 大数据与 MapReduce</a></td>
<td>工具</td>
<td>空缺 - 有兴趣私聊片刻</td>
<td>842376188</td>
</tr>
<tr>
<td>Ml项目实战</td>
<td><a href="/apachecn/MachineLearning/blob/master/docs/16.推荐系统.md">第 16 章: 推荐系统</a></td>
<td><a href="/apachecn/AiLearning/blob/master/docs/16.推荐系统.md">第 16 章: 推荐系统</a></td>
<td>项目</td>
<td>空缺 - 有兴趣私聊片刻</td>
<td>842376188</td>
Expand Down Expand Up @@ -186,7 +186,7 @@

![](images/NLP/F94581F64C21A1094A473397DFA42F9C.jpg)

* 入门教程需看资料【添加比赛链接】: https://github.com/apachecn/MachineLearning/tree/dev/docs/NLP
* 入门教程需看资料【添加比赛链接】: https://github.com/apachecn/AiLearning/tree/dev/docs/NLP
* Python 自然语言处理 第二版: https://usyiyi.github.io/nlp-py-2e-zh

### 中文分词:
Expand Down
14 changes: 7 additions & 7 deletions docs/1.机器学习基础.md
Original file line number Diff line number Diff line change
@@ -1,6 +1,6 @@
# 第1章 机器学习基础

![机器学习基础_首页](../images/1.MLFoundation/机器学习基础-首页.jpg)
![机器学习基础_首页](/img/1.MLFoundation/机器学习基础-首页.jpg)

## 机器学习 概述

Expand Down Expand Up @@ -86,11 +86,11 @@
这个算法可以训练程序做出某一决定。程序在某一情况下尝试所有的可能行动,记录不同行动的结果并试着找出最好的一次尝试来做决定。 属于这一类算法的有马尔可夫决策过程。
### 训练过程

![机器学习训练过程图](../images/1.MLFoundation/机器学习基础训练过程.jpg)
![机器学习训练过程图](/img/1.MLFoundation/机器学习基础训练过程.jpg)

### 算法汇总

![算法汇总](../images/1.MLFoundation/ml_algorithm.jpg)
![算法汇总](/img/1.MLFoundation/ml_algorithm.jpg)


## 机器学习 使用
Expand All @@ -104,7 +104,7 @@

> 举例
![选择算法图](../images/1.MLFoundation/机器学习基础-选择算法.jpg)
![选择算法图](/img/1.MLFoundation/机器学习基础-选择算法.jpg)

> 机器学习 开发流程
Expand Down Expand Up @@ -215,7 +215,7 @@ F 值 = 70% * 50% * 2 / (70% + 50%) = 58.3%

下面这个图可以比较直观地展示出来:

![](../images/1.MLFoundation/ml_add_1.jpg)
![](/img/1.MLFoundation/ml_add_1.jpg)

### 特征工程的一些小东西

Expand All @@ -225,7 +225,7 @@ F 值 = 70% * 50% * 2 / (70% + 50%) = 58.3%

下面给出一个特征工程的图:

![](../images/1.MLFoundation/ml_add_2.jpg)
![](/img/1.MLFoundation/ml_add_2.jpg)

### 其他

Expand All @@ -235,5 +235,5 @@ F 值 = 70% * 50% * 2 / (70% + 50%) = 58.3%
* * *

* **作者:[片刻](http://cwiki.apachecn.org/display/~jiangzhonglian) [1988](http://cwiki.apachecn.org/display/~lihuisong)**
* [GitHub地址](https://github.com/apachecn/MachineLearning): <https://github.com/apachecn/MachineLearning>
* [GitHub地址](https://github.com/apachecn/AiLearning): <https://github.com/apachecn/AiLearning>
* **版权声明:欢迎转载学习 => 请标注信息来源于 [ApacheCN](http://www.apachecn.org/)**
18 changes: 9 additions & 9 deletions docs/10.k-means聚类.md
Original file line number Diff line number Diff line change
@@ -1,7 +1,7 @@

# 第 10 章 K-Means(K-均值)聚类算法

![K-Means(K-均值)聚类算法_首页](../images/10.KMeans/K-Means_首页.jpg)
![K-Means(K-均值)聚类算法_首页](/img/10.KMeans/K-Means_首页.jpg)
## 聚类
聚类,简单来说,就是将一个庞杂数据集中具有相似特征的数据自动归类到一起,称为一个簇,簇内的对象越相似,聚类的效果越好。它是一种无监督的学习(Unsupervised Learning)方法,不需要预先标注好的训练集。聚类与分类最大的区别就是分类的目标事先已知,例如猫狗识别,你在分类之前已经预先知道要将它分为猫、狗两个种类;而在你聚类之前,你对你的目标是未知的,同样以动物为例,对于一个动物集来说,你并不清楚这个数据集内部有多少种类的动物,你能做的只是利用聚类方法将它自动按照特征分为多类,然后人为给出这个聚类结果的定义(即簇识别)。例如,你将一个动物集分为了三簇(类),然后通过观察这三类动物的特征,你为每一个簇起一个名字,如大象、狗、猫等,这就是聚类的基本思想。

Expand Down Expand Up @@ -48,7 +48,7 @@ kmeans,如前所述,用于数据集内种类属性不明晰,希望能够

有关 ```质心` 术语更形象的介绍, 请参考下图:

![K-Means 术语图](../images/10.KMeans/apachecn-k-means-term-1.jpg)
![K-Means 术语图](/img/10.KMeans/apachecn-k-means-term-1.jpg)

### K-Means 工作流程
1. 首先, 随机确定 K 个初始点作为质心(**不必是数据中的点**)。
Expand Down Expand Up @@ -147,19 +147,19 @@ def kMeans(dataSet, k, distMeas=distEclud, createCent=randCent):
```

#### 测试函数
1. 测试一下以上的基础函数是否可以如预期运行, 请看: <https://github.com/apachecn/MachineLearning/blob/master/src/py2.x/ML/10.kmeans/kMeans.py>
2. 测试一下 kMeans 函数是否可以如预期运行, 请看: <https://github.com/apachecn/MachineLearning/blob/master/src/py2.x/ML/10.kmeans/kMeans.py>
1. 测试一下以上的基础函数是否可以如预期运行, 请看: <https://github.com/apachecn/AiLearning/blob/master/src/py2.x/ML/10.kmeans/kMeans.py>
2. 测试一下 kMeans 函数是否可以如预期运行, 请看: <https://github.com/apachecn/AiLearning/blob/master/src/py2.x/ML/10.kmeans/kMeans.py>

参考运行结果如下:
![K-Means 运行结果1](../images/10.KMeans/apachecn-k-means-run-result-1.jpg)
![K-Means 运行结果1](/img/10.KMeans/apachecn-k-means-run-result-1.jpg)



### K-Means 聚类算法的缺陷
> 在 kMeans 的函数测试中,可能偶尔会陷入局部最小值(局部最优的结果,但不是全局最优的结果).
局部最小值的的情况如下:
![K-Means 局部最小值1](../images/10.KMeans/apachecn-kmeans-partial-best-result-1.jpg)
![K-Means 局部最小值1](/img/10.KMeans/apachecn-kmeans-partial-best-result-1.jpg)
出现这个问题有很多原因,可能是k值取的不合适,可能是距离函数不合适,可能是最初随机选取的质心靠的太近,也可能是数据本身分布的问题。

为了解决这个问题,我们可以对生成的簇进行后处理,一种方法是将具有最大**SSE**值的簇划分成两个簇。具体实现时可以将最大簇包含的点过滤出来并在这些点上运行K-均值算法,令k设为2。
Expand Down Expand Up @@ -224,12 +224,12 @@ def biKMeans(dataSet, k, distMeas=distEclud):
```

#### 测试二分 KMeans 聚类算法
* 测试一下二分 KMeans 聚类算法,请看: <https://github.com/apachecn/MachineLearning/blob/master/src/py2.x/ML/10.kmeans/kMeans.py>
* 测试一下二分 KMeans 聚类算法,请看: <https://github.com/apachecn/AiLearning/blob/master/src/py2.x/ML/10.kmeans/kMeans.py>

上述函数可以运行多次,聚类会收敛到全局最小值,而原始的 kMeans() 函数偶尔会陷入局部最小值。
运行参考结果如下:
![二分 K-Means 运行结果1](../images/10.KMeans/apachecn-bikmeans-run-result-1.jpg)
![二分 K-Means 运行结果1](/img/10.KMeans/apachecn-bikmeans-run-result-1.jpg)

* **作者:[那伊抹微笑](http://www.apache.wiki/display/~xuxin), [清都江水郎](http://cwiki.apachecn.org/display/~xuzhaoqing)**
* [GitHub地址](https://github.com/apachecn/MachineLearning): <https://github.com/apachecn/MachineLearning>
* [GitHub地址](https://github.com/apachecn/AiLearning): <https://github.com/apachecn/AiLearning>
* **版权声明:欢迎转载学习 => 请标注信息来源于 [ApacheCN](http://www.apachecn.org/)**
Loading

0 comments on commit 1a54fb9

Please sign in to comment.