Skip to content

kevin-meng/learn-data-analysis-the-hard-way

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

32 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

笨办法学数据分析

Learn Data Analysis The Hard Way

引言

这是笨办法学习数据分析系列的代码仓库。之所以叫笨办法,方法上主要是受了我之前学习Python的启蒙书籍 ——《笨办法学 Python》的启发。而形式上受参考链接 [1] 的启发。

这套材料,不光是我自学时候的总结,也是当初在团队内部对转岗新人培训的材料,经过实践检验,效果很好。最近我打算,对这套材料进行扩充和完善,并开源出来。

项目内容

整个项目,围绕常用的数据分析工具展开。

在每个板块我都会尽量为大家准备好Docker环境, 让大家做到开箱即学,开箱即练的目的.

1. SQL 篇

- 常见面试 50 题

2. Pandas 篇

    1. 设置 (Settings)
    1. 加载和存储数据 (Data Loading & Storage)
    1. 数据预览 (Data Glimpse)
    1. 排序过滤与删除 (Sorting & Flitering & Deleting)
    1. 缺失值 (Missing Data)
    1. 时间序列分析 (Time_Series_Analysis )
    1. 合并与拼接 (Merge & Concat )
    1. 聚合与透视 (Groupby & Pivot )
    1. 可视化 (Visualization)
    1. 报告 (Report)

项目特点

  • 环境支持:提供相应docker环境,开箱即用。

  • 配套练习:从了解到掌握,需要大量重复练习(建议每个方法,手敲21遍!)

  • 框架清晰:以工作流为线索,由浅入深。最终结束是利用所学,写一篇分析报告。 这里我必须强调一点!

    不要复制!

    不要复制!!

    不要复制!!!

    请亲手敲每一个函数,这很关键。

总结

希望整个系列对你有帮助。后面有时间,我也会录制相应的视频,敬请期待!

TO DO List

  • SQL
  • Pandas
  • Numpy
  • Spark
  • Flink
  • 视频版

参考链接

  1. https://github.com/guipsamora/pandas_exercises

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published