GitHub - Kuntal-G/BigData-Analytics: Analytics projects using Big Data eco-systems (Hadoop, Spark, Storm)

Big Data Analytics:

This repository contains some analytics projects using Big Data eco-systems (Hadoop, Spark, Storm, Hbase and Zookeeper)listed below:

Hadoop Analytics

Some real world use cases using hadoop map reduce design pattern (TopK, Secondary Sorting, Filtering, Summarization, Join, Friend Recommendation)

Spark Analytics

Some simplified real world scenarios using Apache Spark, MLlib (Email spam detection, User Purchase statistics, Twitter data analysis with Hive,etc)

Storm Analytics

This projects contains some simple examples with storm (Github commit count, Twitter stream analysis,Topology statistics,etc)

Hbase-coprocessor

An example of Hbase Aggregation client to carry out( row count, min-max, average) values of a table.Also a region co-processor to hook value before get operation.

Zookeeper distributed-queue

An example of distributed queue using apache zookeeper and curator framework from Netflix.

Name		Name	Last commit message	Last commit date
Latest commit History 30 Commits
hadoop-analytics		hadoop-analytics
hbase-coprocessor		hbase-coprocessor
spark-analytics		spark-analytics
storm-analytics		storm-analytics
zookeeper-distributed-queue		zookeeper-distributed-queue
.project		.project
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Big Data Analytics:

Hadoop Analytics

Spark Analytics

Storm Analytics

Hbase-coprocessor

Zookeeper distributed-queue

About

Releases

Packages

Languages

Kuntal-G/BigData-Analytics

Folders and files

Latest commit

History

Repository files navigation

Big Data Analytics:

Hadoop Analytics

Spark Analytics

Storm Analytics

Hbase-coprocessor

Zookeeper distributed-queue

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages