Este repositório contém o código-fonte e os dados utilizados na disciplina de Engenharia de Software Experimental, tópico Análise Quantitativa, do Programa de Pós-Graduação em Ciência da Computação da UFBA (PGCOMP).
- Aula 1 (2/3/2017)
- Introdução à disciplina - código-fonte
- Análise de dados - código-fonte
- Introdução à linguagem R - código-fonte
- Transformação de dados (com dplyr) - código-fonte
- Exemplo: Eclipse metrics - código-fonte
- Leituras recomendadas:
- Aula 2 (9/3)
- Análise exploratória de dados - código-fonte
- Visualização de dados (com ggplot2)
- Data set GHTorrent (ver abaixo, Trabalho prático)
- Aula 3 (16/3)
- Noções de amostragem, probabilidade e estimativa: código-fonte e slides complementares
- Ver análise de artigo, valendo 1,0 ponto, para a próxima aula
- Aula 4 (23/3)
- Teste de hipótese e tamanho de efeito: código-fonte e slides
- Aula 5 (30/3)
- Correlação, regressão e predição: código-fonte
Artigo: Sentiment Analysis of Commit Comments in GitHub: An Empirical Study
Prazo: 22/03/2017
Elabore uma análise do artigo, em português, contendo os seguintes itens:
- Um parágrafo de resumo do artigo, descrevendo o objetivo, a metodologia e os principais resultados do artigo.
- Para cada questão de pesquisa:
- Descrição da questão
- Quais variáveis foram estudadas
- Para cada variável estudada: como ela é medida (ou seja, qual a métrica usada), se ela é dependente ou independente, se ela é nominal, ordinal, discreta ou contínua.
- Descrição das análises realizadas:
- Os dados precisaram ser transformados? Se sim, como?
- Foi usada estatística descritiva? Se sim, que estatísticas e gráficos foram apresentados?
- Foi usada estatística inferencial? Se sim, quais testes foram realizados? O tamanho do efeito foi medido?
- Uma sugestão de análise que poderia ter sido realizada para apoiar alguma das questões de pesquisa do artigo ou uma nova questão de pesquisa a sua escolha.
Data set: msr14sample -- versão modificada do GHTorrent MSR 2014 (ver schema).
Alguns trabalhos que usam esse data set podem ser encontrados no programa do MSR Challenge 2014 (ver sessão das 16:00-17:00, MSR Challenge).
Em duplas, elaborem um relatório de análise do data set, seguindo o padrão do arquivo exemplo-ghtorrent.Rmd, no formato documento R Markdown. Você precisará definir 2 questões de pesquisa.
Publique o relatório no RPubs.com; envie o link e o código-fonte (arquivo .Rmd
) para rodrigorgs@ufba.br
Prazo: 06/04/2017
R:
Estatística: