Este é um projeto de Business Intelligence que teve inicio durante o Bootcamp de Data Engineering da How Bootcamps em 2023. Ao longo do tempo incluí melhorias de estrutura de projeto e documentação.
Este projeto possui 2 objetivos principais:
- Explorar o conceito de Conteinerização para gestão de dependências e ambientes virtuais.
- Criar uma estrutura de BI do zero, implementando um banco de dados e uma ferramenta de BI.
https://strangercacaus.github.io/resultados_do_futebol_desde_1980/
Para a criação de tabelas e views de maneira programática foi utilizado Python, assim como para a ingestão de dados e inserção no banco. As bibliotecas utilizadas na rotina foram
sqlalchemy
,requests
epandas
O banco de dados escolhido para o projeto foi o PostgreSQL em razão de ser Open-Source e amplamente adotado.
Também Open-Source e compatível com Docker, o Metabase foi a ferramenta de BI escolhida para a exploração dos dados do projeto.
O Docker foi utilizado para a virtualização do ambiente de execução.
root
├── .bi_volume/ # Diretório vinculado ao conteiner docker na imagem do metabase.
├── .db_volume/ # Diretório vinculado ao conteiner docker na imagem do postgresql.
├── backups/ # Diretório com o backup dos dados contidos no .bi_volume e .db_volume.
├── docs/ # Arquivos de documentação
├── sql_files/ # Comandos DML para criação de tabelas e views.
├── src/
│ └── main.py # Script de ingestão
├── previews/ # Prints e imagens do projeto
├── .env # Arquivo com credenciais de acesso ao banco de dados.
├── requirements.txt
├── .gitignore
├── docker-compose.yml # Arquivo de configuração do ambiente do Docker
├── mkDocs.yaml # Arquivo de configuração da documentação
└── README.md