Learn Data Analysis The Hard Way
这是笨办法学习数据分析系列的代码仓库。之所以叫笨办法,方法上主要是受了我之前学习Python的启蒙书籍 ——《笨办法学 Python》的启发。而形式上受参考链接 [1] 的启发。
这套材料,不光是我自学时候的总结,也是当初在团队内部对转岗新人培训的材料,经过实践检验,效果很好。最近我打算,对这套材料进行扩充和完善,并开源出来。
整个项目,围绕常用的数据分析工具展开。
在每个板块我都会尽量为大家准备好Docker环境, 让大家做到开箱即学,开箱即练的目的.
- 常见面试 50 题
-
- 设置 (Settings)
-
- 加载和存储数据 (Data Loading & Storage)
-
- 数据预览 (Data Glimpse)
-
- 排序过滤与删除 (Sorting & Flitering & Deleting)
-
- 缺失值 (Missing Data)
-
- 时间序列分析 (Time_Series_Analysis )
-
- 合并与拼接 (Merge & Concat )
-
- 聚合与透视 (Groupby & Pivot )
-
- 可视化 (Visualization)
-
- 报告 (Report)
-
环境支持:提供相应docker环境,开箱即用。
-
配套练习:从了解到掌握,需要大量重复练习(建议每个方法,手敲21遍!)
-
框架清晰:以工作流为线索,由浅入深。最终结束是利用所学,写一篇分析报告。 这里我必须强调一点!
不要复制!
不要复制!!
不要复制!!!
请亲手敲每一个函数,这很关键。
希望整个系列对你有帮助。后面有时间,我也会录制相应的视频,敬请期待!
- SQL
- Pandas
- Numpy
- Spark
- Flink
- 视频版