Skip to content

Analisis Inteligente de Datos - Trabajo Práctico - Asteroides Peligrosos

Notifications You must be signed in to change notification settings

magistery-tps/aid-tp

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

74 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

University of Buenos Aires (UBA)
Master in Data Mining and Knowledge Discovery
Analisis Inteligente de Datos

Trabajo Práctico: Asteroides Peligrosos

En este trabajo práctico se aborda el problema de detección de objetos próximos a la tierra.

Informe

Ver Informe.

Notebook

En el sitio RPubs se encuentra publicada la notebook desarrollada para realizar el trabajo practico. Ver Notebook.

Fuente de datos

Para abordar este trabajo práctico se seleccionó el dataset NASA: Asteroids Classification. El mismo fue generador en el sitio cneos.jpl.nasa.gov el cual tiene una herramienta de consulta de datos de asteroides y comentas. El dataset contiene 40 variables, en su mayoría cuantitativas (Continuas) y una pocas cualitativas (Categóricas y Nominales). Para más detalle ver nasa.csv.

Descargar Proyecto

Hay dos alternativas para descargar el proyecto:

Descarga directa

Se puede descargar directamente desde Aqui.

Descarga via Git

Paso 1: Instalar git.

Paso 2: Ahora si, clonamos el repositorio.

$ git clone https://github.com/magistery-tps/aid-tp.git
$ cd aid-tp

Ejecutar Notebook

Para ejecutar el proyecto es necesario realizar los siguientes pasos:

Paso 1: En RStudio abrir el archivo scripts/notebook.Rmd.

Paso 2: Luego en la consola ejecutar la siguiente linea:

install.packages('pacman')

Esto es necesario para instalar los paquetes utilizados en el proyecto. Se utilizo el sistema de paquetes pacman el cual instala y carga los paquetes mediante la funcion p_load.

Nota: Es importante aclarar que el dataset ya esta incluido en el proyecto.

Implementación

Para realizar este trabajo practico, fue necesario desarrollar una libreria de funciones para abstraernos de como se realiza cada paso de nuestro analisis. De esta manera se obtienen los siguientes beneficios:

  • Se simplifica notablemente la lectura del analisis principal en la Notebook.
  • Se obtiene una libreria de funciones casi genericas, las cuales se podran reutilizar en proximos trabajos practicos.

Como aclaracion final, todas la librerias se importan al inicia de la Notebook con la siguiten linea:

import('../lib/common-lib.R')

Donde common-lib.R importa las siguientes librerias:

# Librerias mas basicas
reflection.R
data-frame.R
scale.R
csv.R

# Funciones para graficar
plot.R
hist.R
pie.R

# Analisis exploratorio
importance.R
correlation.R
pca.R

# Modelos
set_split.R
models.R
test.R
metrics.R
balance.R

Por otro lado hay funciones que son especificas para nuestro analisis (No son genericas). Estas se encuentran en el archivo scripts/helper_functions.R.