Skip to content

Projeto de Data Science com Power BI desenvolvido durante o Challenge BI Alura: Edição #2 em fevereiro de 2022.

Notifications You must be signed in to change notification settings

carolpossi/challenge-bi-alura-2022

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Projeto de BI e Data Science desenvolvido para o Challenge BI: Edição #2 da Alura em fevereiro de 2022.

Desafio proposto: construir um dashboard para a visualização e análise de dados sobre uma pesquisa de mercado para uma nova produção da Alura Films.

A Alura Films contratou você para fazer uma pesquisa de mercado, com a finalidade de identificar a seleção ideal de elenco e produção. Para isso, ela disponibilizou uma base de dados do IMDB com 1000 filmes. Use suas habilidades e conhecimentos para explorar, tratar e transformar os dados em informações relevantes que auxiliem na tomada de decisão da empresa.

Escolhi a plataforma Microsoft Power BI para este desafio. Clique aqui para acessar o dashboard na web.

🎲 Base de Dados

  • Filmes.csv: Arquivo CSV com os top 1000 filmes de acordo com a classificação IMDB, com informações adicionais como ano de lançamento, gênero, atores e atrizes principais, avaliações, quantidade de votos, faturamento, entre outros.
  • Posters.csv: Arquivo CSV com os URLs das imagens correspondentes aos pôsteres dos filmes listados em Filmes.csv.

📊 Páginas

Separei as métricas sugeridas(✔) em grupos, cada um em uma página do Dashboard, e tamblém inclui outras métricas(➕) que considerei relevantes ou interessantes.

Gêneros

  • ✔ Gêneros mais rentáveis (Faturamento)
  • ✔ Gêneros mais frequentes (Quantidade de filmes)
  • ➕Relação entre duração e faturamento por gênero
  • ➕Faturamento médio por gênero

🔻 Filtragem: hierarquia de gênero (principal, secundário e terciário)

Avaliações

  • ✔ Filmes mais votados
  • ✔ Metascore, IMDB, Número de Votos
  • ➕Relação entre faturamento e avaliação (Metascore e IMDB)
  • ➕Média de avaliações por ano de lançamento

🔻 Filtragem: gênero principal, ano de lançamento, faturamento

A tabela de filmes, à direita da página, possui a seguinte dica de ferramenta habilitada:

Tooltop Filmes (Página Avaliações)

Estrelas

  • ✔ Faturamento do Filmes por Estrela 1, 2 3 e 4
  • ✔ Estrelas que mais aparecem nos filmes
  • ➕Resumo das estrelas com avaliações médias, primeiro e último ano de lançamento, gêneros, faturamento e quantidade de filmes

📐Cálculos e Transformação de Dados

Novas Tabelas

Além das tabelas fonte, Filmes e Posters , criei outras duas tabelas, Estrelas e Genre , pois a fonte possui múltiplos valores para descrever o gênero do filme, assim como múltiplas estrelas (atores e atrizes) por filme. Separando os valores em colunas e transformando as colunas em linhas, foram obtidas as tabelas desejadas, com as quais foi possível construir os gráficos e filtros apresentados anteriormente. Este processo foi necessário para evitar a duplicação de valores desnecessários na tabela fonte.

Tabela Estrelas - Cabeçalho Tabela Gênero - Cabeçalho
Cabeçlho Tabela Estrelas Cabeçlho Tabela Genre

A coluna Id_Title serve como chave para todas as relações.

Novas Colunas

Para montar a tabela de filmes na página de Avaliações, criei as colunas abaixo:

  • Filme e Ano = Filmes[Series_Title] & " (" & Filmes[Released_Year] & ")"
    • Concatenação de duas informações relevantes sobre o filme
  • Diferença Avaliações = IF(Filmes[IMDB_Rating] <> 0 && Filmes[Meta_score] <> 0,ABS(Filmes[Meta_score]-Filmes[IMDB_Rating]),0)
    • Representa o grau de controvérsia de um filme com base nas diferença entre as avaliações das duas fontes disponibilizadas.

🗨️Considerações e Aprendizados

  • Minha intenção foi de confeccionar um dashboard interativo, para que o usuário manipule os filtros e navegue pelas tabelas e visualizações a fim de tirar suas próprias conclusões;
  • Escolhi uma paleta de cores terrosas e quentes que me agradou bastante, porém, sinto que limitei muito minhas opções, e tive dificuldades de manter a paleta em visualizações classificadas por múltiplas categorias, como gênero;
  • Tive receio de poluir as páginas com gráficos e outras visualizações em excesso, e creio que este posicionamento não foi vantajoso. Poderia ter contornado essa preocupação utilizando mais filtros e indicadores, dessa forma poderia apresentar mais informações sem o excesso de elementos visuais;
  • Na página Estrelas, o resumo de estrelas (conjunto de formas e visualizações à esquerda da página) estava originalmente contido num tooltip (dica de ferramenta), porém dessa forma, as informações que considero interessantes só seriam reveladas pela interação com o gráfico, além da inevitável concentração de informação num espaço tão pequeno como o tooltip;
    • Ao dispor as visualizações na página, estes problemas são resolvidos, mas uma outra desvantagem surge: enquanto o filtro da página não for exatamente uma única estrela selecionada a partir dos gráficos, a informação apresentada no resumo se torna inconsistente;
  • Durante o desenvolvimento, minha preocupação com o visual teve um grande peso, e isso pode ter prejudicado a relação entre os componentes do relatório. Tenho a sensação de que poderia ter realçado os dados interessantes para contribuir com o storytelling, a história contada através do relatório;
    • Por mais que gráficos, as visualizações que mais utilizei, apresentem mais informações, elementos como cartões trazem o destaque e realce apropriado;
  • Este projeto, além de ser meu primeiro dashboard, foi iniciado poucos dias após minha primeira interação com o Power BI. Portanto, por mais que sinta que o resultado não é excelente, considerando minha inexperiência, gostei do que pude apresentar, o projeto contribuiu muito para meu aprendizado e estou satisfeita.

About

Projeto de Data Science com Power BI desenvolvido durante o Challenge BI Alura: Edição #2 em fevereiro de 2022.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published