Real-Time Stock Market Data Pipeline and Analytics Using Kafka and AWS

Description

This project demonstrates a scalable and efficient Real-Time Stock Market Data Pipeline using Apache Kafka and AWS Services. The system simulates real-time stock market data, processes events, and provides analytics-ready datasets.

Key Features:

Real-Time Data Streaming: Stock market data simulation and event publishing to an Apache Kafka broker hosted on an AWS EC2 instance.
Data Ingestion and Storage: Streamed events are stored in Amazon S3, ensuring durability and accessibility.
Automated Schema Inference: Leveraged AWS Glue Crawler to build a Glue Data Catalog for schema automation and seamless data exploration.
SQL-Based Analytics: Used Amazon Athena for querying and analyzing stock market data, enabling real-time insights.

This end-to-end data pipeline integrates event streaming, storage, and analytics to demonstrate the power of real-time data engineering and processing.

Architecture

Technology Used

Programming Language:

Python

Amazon Web Services (AWS):

S3: Data storage.
Athena: SQL-based analytics.
Glue Crawler: Automated schema inference.
Glue Catalog: Unified metadata management.
EC2: Kafka broker hosting.
Apache Kafka: Real-time event streaming.

How to Use

Clone this repository:

git clone https://github.com/akhilrathod09/Real-Time-Stock-Market-Data-Pipeline-and-Analytics-Using-Kafka-and-AWS.git

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
.gitattributes		.gitattributes
Architecture.jpg		Architecture.jpg
KafkaConsumer.ipynb		KafkaConsumer.ipynb
KafkaProducer.ipynb		KafkaProducer.ipynb
README.md		README.md
command_kafka.txt		command_kafka.txt
indexProcessed.csv		indexProcessed.csv
scrape_data.py		scrape_data.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Real-Time Stock Market Data Pipeline and Analytics Using Kafka and AWS

Description

Key Features:

Architecture

Technology Used

Programming Language:

Amazon Web Services (AWS):

How to Use

About

Uh oh!

Releases

Packages

Languages

akhilrathod09/Real-Time-Stock-Market-Data-Pipeline-and-Analytics-Using-Kafka-and-AWS-

Folders and files

Latest commit

History

Repository files navigation

Real-Time Stock Market Data Pipeline and Analytics Using Kafka and AWS

Description

Key Features:

Architecture

Technology Used

Programming Language:

Amazon Web Services (AWS):

How to Use

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages