Serão desenvolvidos três projetos durante a Residencia Tech de Analise Dados, da Harve:
- Projeto Olist (individual)
- Projeto Setor Público (individual)
- Projeto Revelo (grupo)
Sobre o banco de dados:
Este conjunto de dados foi generosamente fornecido pela Olist, que conecta pequenas empresas de todo o Brasil aos Marketplaces sem complicações e com um único contrato. Esses comerciantes podem vender seus produtos através da Olist Store e enviá-los diretamente aos clientes usando os parceiros de logística da Olist.
Veja mais no site: www.olist.com
Fonte: https://www.kaggle.com/datasets/olistbr/brazilian-ecommerce
Desafio:
Responder, como Analista de dados, aos nove Backlog´s demandados pelo Product Owner, que estão detalhados no arquivo "Sprint Planning 1.pdf".
Descrição do Github:
- Pasta > Tabelas: estão todas as tabelas utilizadas.
- Arquivos:
- Sprint Planing 1.pdf: detalhes dos Backlog´s demandados pelo Product Owner, esquema dos dados e cronograma de execução.
- Slides Apresentação para Harve.pdf: esses são os slides da apresentação das conclusões das demandas, apresentadas a banca da Harve, no dia 14.10.2022.
- Apresentação detalhada Projeto 1 Olist.pdf: a transcrição da apresentação, com slides, explicações e conclusões sobre o banco de dados feitos por mim.
- Olist.ipynb: respostas do projeto em python, usando Jupiter.
- Projeto Olist Script.py: respostas do projeto em python.
Observações sobre Projeto:
Neste projeto não foi determinado uma ferramenta a ser usada, apenas uma sugestão para Python. A escolha ficou a critério de cada aluno. Tínhamos quatro semanas até a entrega final e trabalhamos com metodologia ágil, com daily´s diárias com Scrum master.
Eu iniciei utilizando Python, mesmo sem muita experiência com ele, com o objetivo de praticar porque havia feito um curso básico anteriormente. Consegui desenvolver sete das nove questões utilizando o Python, porém a minha maior dificuldade, entre outras, foi criar os gráficos para a visualização. Percebi que estava perdendo muito tempo em aprender a fazer os gráficos e não estava tendo o resultado que pretendia. Por isso decidi reiniciar o projeto utilizando o Power BI, com o qual pude resolver as questões e desenvolver as visualizações de maneira mais satisfatória, na minha opinião, por ter mais experiência com a ferramenta. Contudo essas mudanças me atrasaram e acabei deixando de responder duas demandas na apresentação para a banca.
Outro ponto que demandou muito tempo foi a limpeza dos dados dos estados para responder as questões sete e oito. Muitas cidades com grafias erradas e em estados diferentes dos originais.
Apresentação:
VIDEO_INTROD_PROJ1m.mp4
🔈 Ative o som, por favor!
Para ver o Overview das três apresentações dos projetos, clique no link: https://youtu.be/MBJQa1rW_VA
Para ver a apresentação completa deste projeto, clique no link: https://youtu.be/e8BFurxC9Uk