Skip to content

josonle/Realtime-Data-Warehouse

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Realtime-Data-Warehouse

本项目涉及实时数据仓库搭建相关,是实习期间和几位大神朋友一起协作完成的课题,在此感谢几位大佬@鑫锋@葛老师@丁哥的帮助

技术路线

一图胜千言,如图是所使用的大数据组件,离线数仓的搭建涉及Kafka、Flume、Sqoop、Hive,实时路线包含Kafka、SparkStreaming、Kudu,最终的展示由Impala查询Hive和Kudu上相关数据,作OLAP分析,分析结果由Tableau展示

img

  • 离线数据采集

    • Kafka+Flume+HDFS 构建消息采集系统

    img

    • Sqoop作数据库到数仓的桥梁
  • 数据仓库数据分层和维度建模的设计

    img

  • 实时消息处理

img

About

实时数据仓库搭建

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published