Projeto de BI e Data Science desenvolvido para o Challenge BI: Edição #2 da Alura em fevereiro de 2022.
Desafio proposto: construir um dashboard para a visualização e análise de dados sobre uma pesquisa de mercado para uma nova produção da Alura Films.
A Alura Films contratou você para fazer uma pesquisa de mercado, com a finalidade de identificar a seleção ideal de elenco e produção. Para isso, ela disponibilizou uma base de dados do IMDB com 1000 filmes. Use suas habilidades e conhecimentos para explorar, tratar e transformar os dados em informações relevantes que auxiliem na tomada de decisão da empresa.
Escolhi a plataforma Microsoft Power BI para este desafio. Clique aqui para acessar o dashboard na web.
Filmes.csv
: Arquivo CSV com os top 1000 filmes de acordo com a classificação IMDB, com informações adicionais como ano de lançamento, gênero, atores e atrizes principais, avaliações, quantidade de votos, faturamento, entre outros.Posters.csv
: Arquivo CSV com os URLs das imagens correspondentes aos pôsteres dos filmes listados emFilmes.csv
.
Separei as métricas sugeridas(✔) em grupos, cada um em uma página do Dashboard, e tamblém inclui outras métricas(➕) que considerei relevantes ou interessantes.
- ✔ Gêneros mais rentáveis (Faturamento)
- ✔ Gêneros mais frequentes (Quantidade de filmes)
- ➕Relação entre duração e faturamento por gênero
- ➕Faturamento médio por gênero
🔻 Filtragem: hierarquia de gênero (principal, secundário e terciário)
- ✔ Filmes mais votados
- ✔ Metascore, IMDB, Número de Votos
- ➕Relação entre faturamento e avaliação (Metascore e IMDB)
- ➕Média de avaliações por ano de lançamento
🔻 Filtragem: gênero principal, ano de lançamento, faturamento
A tabela de filmes, à direita da página, possui a seguinte dica de ferramenta habilitada:
- ✔ Faturamento do Filmes por Estrela 1, 2 3 e 4
- ✔ Estrelas que mais aparecem nos filmes
- ➕Resumo das estrelas com avaliações médias, primeiro e último ano de lançamento, gêneros, faturamento e quantidade de filmes
Além das tabelas fonte, Filmes
e Posters
, criei outras duas tabelas, Estrelas
e Genre
, pois a fonte possui múltiplos valores para descrever o gênero do filme, assim como múltiplas estrelas (atores e atrizes) por filme. Separando os valores em colunas e transformando as colunas em linhas, foram obtidas as tabelas desejadas, com as quais foi possível construir os gráficos e filtros apresentados anteriormente.
Este processo foi necessário para evitar a duplicação de valores desnecessários na tabela fonte.
Cabeçlho Tabela Estrelas |
Cabeçlho Tabela Genre |
A coluna Id_Title
serve como chave para todas as relações.
Para montar a tabela de filmes na página de Avaliações, criei as colunas abaixo:
Filme e Ano = Filmes[Series_Title] & " (" & Filmes[Released_Year] & ")"
- Concatenação de duas informações relevantes sobre o filme
Diferença Avaliações = IF(Filmes[IMDB_Rating] <> 0 && Filmes[Meta_score] <> 0,ABS(Filmes[Meta_score]-Filmes[IMDB_Rating]),0)
- Representa o grau de controvérsia de um filme com base nas diferença entre as avaliações das duas fontes disponibilizadas.
- Minha intenção foi de confeccionar um dashboard interativo, para que o usuário manipule os filtros e navegue pelas tabelas e visualizações a fim de tirar suas próprias conclusões;
- Escolhi uma paleta de cores terrosas e quentes que me agradou bastante, porém, sinto que limitei muito minhas opções, e tive dificuldades de manter a paleta em visualizações classificadas por múltiplas categorias, como gênero;
- Tive receio de poluir as páginas com gráficos e outras visualizações em excesso, e creio que este posicionamento não foi vantajoso. Poderia ter contornado essa preocupação utilizando mais filtros e indicadores, dessa forma poderia apresentar mais informações sem o excesso de elementos visuais;
- Na página
Estrelas
, o resumo de estrelas (conjunto de formas e visualizações à esquerda da página) estava originalmente contido num tooltip (dica de ferramenta), porém dessa forma, as informações que considero interessantes só seriam reveladas pela interação com o gráfico, além da inevitável concentração de informação num espaço tão pequeno como o tooltip;- Ao dispor as visualizações na página, estes problemas são resolvidos, mas uma outra desvantagem surge: enquanto o filtro da página não for exatamente uma única estrela selecionada a partir dos gráficos, a informação apresentada no resumo se torna inconsistente;
- Durante o desenvolvimento, minha preocupação com o visual teve um grande peso, e isso pode ter prejudicado a relação entre os componentes do relatório. Tenho a sensação de que poderia ter realçado os dados interessantes para contribuir com o storytelling, a história contada através do relatório;
- Por mais que gráficos, as visualizações que mais utilizei, apresentem mais informações, elementos como cartões trazem o destaque e realce apropriado;
- Este projeto, além de ser meu primeiro dashboard, foi iniciado poucos dias após minha primeira interação com o Power BI. Portanto, por mais que sinta que o resultado não é excelente, considerando minha inexperiência, gostei do que pude apresentar, o projeto contribuiu muito para meu aprendizado e estou satisfeita.