For the English version, click on the Shield below:
O datazoom_social
é um pacote que compatibiliza microdados de
pesquisas realizadas pelo IBGE. Com o pacote, é possível fazer a leitura
de todas as pesquisas domiciliares realizadas pelo IBGE, compatibilizar
os Censos Demográficos de diferentes anos, gerar identificação dos
indivíduos da PNAD Contínua, e muito mais.
Digite o código abaixo na linha de comando do Stata para baixar e instalar a versão mais recente do pacote
net install datazoom_social, from("https://raw.githubusercontent.com/datazoompuc/datazoom_social_stata/master/") force
Todas as funções do pacote podem ser usadas pelas caixas de diálogo. Para acessá-las, digite o comando
db datazoom_social
Clique nos botões abaixo para ir à helpfile de cada função. Elas são
melhor visualizadas abrindo no Stata, com help função
.
Censo Censo Demográfico 1970 a 2010 |
ECINF Economia Informal Urbana 1997 e 2003 |
PME Pesquisa Mensal de Emprego 1990 a 2015 |
PNAD PNAD Antiga 2001 a 2015 |
PNAD Contínua PNAD Contínua 2012 a 2023 |
PNAD Covid PNAD Covid 2020 |
PNS Pesquisa Nacional de Saúde 2013 e 2019 |
POF Pesquisa de Orçamentos Familiares 1995 a 2018 |
A maioria dos programas do pacote lidam com dados originais armazenados em formato .txt, que precisam de dicionários – formato .dct no Stata – para serem lidos. A consequência é um volume de dicionários que supera o limite de 100 arquivos permitido para um pacote do Stata poder ser instalado. Por isso, os dicionários individuais são compactados em um arquivo .dta único, que é lido dentro de cada programa. Ambas as funções usadas para isso são definidas no arquivo read_compdct.ado.
O primeiro programa definido nesse arquivo é write_compdct
, que pode
ser usado como a seguir: após rodar o arquivo .ado para definir a
função, basta usar o código
write_compdct, folder("/pasta com os dicionários") saving("/caminho/dict.dta")
A função então lê todos os arquivos .dct presentes na pasta, e junta todos no arquivo dict.dta, com cada dicionário identificado por uma variável com seu nome.
Para transformar esse arquivo compactado novamente do dicionário
original, se usa o programa read_compdct
:
read_compdct, compdct("dict.dta") dict_name("dic original") out("dic extraído.dct")
que extrai o “dic original” do arquivo dict.dta e o salva para “dic
extraído.dct”. Como exemplo, veja o uso dessa função no programa
datazoom_pnadcontinua
tempfile dic // Arquivo temporário onde o .dct extraído será salvo
findfile dict.dta // Acha o arquivo dict.dta salvo pela instalação
// do pacote na pasta /ado/, e armazena o caminho
// até ele na macro r(fn)
read_compdct, compdct("`r(fn)'") dict_name("pnadcontinua`lang'") out("`dic'")
// Lê o dicionário compactado dict.dta, extrai o dicionário pnadcontinua
// (ou pnadcontinua_en, `lang` é vazio ou "_en"), e salva o arquivo final
// na tempfile dic, que é usada para ler os dados
Para a nossa organização interna, cada pasta correspondente a um
programa armazena os dicionários na sub-pasta /dct/. Todos esses
dicionários são também armazenados juntos na pasta /dct/ diretamente,
que é usada para gerar o dict.dta através do write_compdct
. Note que
nenhum arquivo .dct é efetivamente listado no arquivo
datazoom_social.pkg, e portanto, não são instalados no computador do
usuário. Apenas o arquivo dict.dta é enviado.
Periodicamente, na manutenção do pacote, temos que rodar a do-file
atualizacao_dict.do
e seguir as instruções.
O Data Zoom é desenvolvido por uma equipe do Departamento de Economia da Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio)
Para citar o pacote datazoom_social
, utilize:
Data Zoom (2023). Data Zoom: Simplifying Access To Brazilian Microdata.
https://www.econ.puc-rio.br/datazoom/english/index.html
Ou, em formato BibTeX:
@Unpublished{DataZoom2023,
author = {Data Zoom},
title = {Data Zoom: Simplifying Access To Brazilian Microdata},
url = {https://www.econ.puc-rio.br/datazoom/english/index.html},
year = {2023},
}