Photo by: @mike_simon
Elaborado por Francico Foz
O challenge é uma iniciativa da Alura para seus alunos desenvolverem projetos baseado em desafios reais.
Três empresas nos contrataram para entender suas bases de dados e exibir informações relevantes com o objetivo de auxiliar suas tomada de decisões.
Conceitos e técnicas de BI serão utilizados para desenvolver um dashboard para uma das empresas.
A primeira empresa, Alura Films, necessita analisar dados sobre o IMDB (Internet Movie Database) dos filmes e suas informações.
A segunda empresa, Alura Food, precisa de um dashboard para analisar o mercado de restaurantes na Índia.
A terceira empresa, Alura Skimo, precisa analisar as métricas de suas vendas.
A Alura Films contratou você para fazer uma pesquisa de mercado, com a finalidade de identificar a seleção ideal de elenco e produção. Para isso, ela disponibilizou uma base de dados do IMDB com 1000 filmes. Use suas habilidades e conhecimentos para explorar, tratar e transformar os dados em informações relevantes que auxiliem na tomada de decisão da empresa.
Para este projeto utilizei a ferramenta Google Data Studio e o Google SpreadSheets
Os dados fornecidos foram dois arquivos .csv, com as informações da tabela de filmes e outra de posters, com a descrição conforme o pdf
Você pode encontrar os dados iniciais aqui
Para a construção do dashboard, realizei o tratamento dos dados para que eles ficassem corretos.
- Tradução da coluna "Genre_PT-BR":
Inseri uma nova coluna no conjunto de dados chamada "Overview_PT-BR" com a tradução das colunas "Overview" e "Genre". Utilizei a função "=GOOGLETRANSLATE()" do google sheets.
- Formatação da coluna "Gross":
Formatei os valores que estavam com formato norte americano de "," no lugar do ".", usando a função SUBSTITUIR() e depois acrescentei mais ",00" e formatei a coluna para moeda.
- Padronização da coluna "Certificate":
Após algumas pesquisas, encontrei os valores equivalentes das classificações indicativas dos filmes e subistituí para que todos ficassem no padrão do Brasil mais os não Classificados:
U: Livre , UA: 10, A: 18, PG-13: 14, Passed: Não Classificado, PG: 10, R: 18, G: Livre, not rated: Não Classificado, Approved: Livre, PG-12: 14, U/A: 10, 12A: 14, TV-14: 14, GP: 10, Unrated: Não Classificado, TV-PG: 10, TV-MA: 18,
- Criei uma nova tabela com as estrelas Separei eles pela função de dividir texto em coluna, ao colar. Manipulei as colunas para que ficassem em apenas uma e repeti o índice, afim de se ter apenas duas colunas e fazer o relacionamento das tabelas.
Construi o dashboard no Data Studio, que foi formado por:
- Um painel inicial de menu.
- Um painel com a visão geral do lucro, com gráficos de filmes, gêneros, notas do IMDB, classificação indiativa e ano. Desta forma pode-se visualizar os gêneros que tiveram maior quantidade de lucro, qual a relação da nota do IMDB com o lucro gerado, a classificação indicativa que abrange maior quantidade de lucro e a evolução do lucro dos filmes por ano.
- Um painel com a visão de elenco e produção, com as informações de diretores, atores e atrizes e gênero com suas respectivas posições no filme para com a quantidade de lucro gerado. Para que desta forma, possa entender quais os melhores elencos e produção gerariam maior quantidade de lucro.
Foi escolhido não separar os gêneros de cada filme para que de fato possa se ter uma informação mais precisa a respeito de cada filme. Por exemplo, há uma quantidade muito grande do gênero drama, porém há diversas outras posições como Drama + Ação + Crime ou Drama + Comédia.
Você pode acessar ele por aqui