Repositorio destinado a la asignatura de Tratamiento Inteligente de Datos del Máster en Ingeniería Informática en la UGR.
El repositorio se descomponen en trabajos teóricos y prácticos realizados en la asignatura.
- Preprocesamiento de datos: Se aplican técnicas de preprocesamiento sobre una base de datos de accidentes de coche.
- Clustering: Se aplican diferentes técnicas de clustering sobre una base de datos de vinos.
- Clasificación: Se aplican diferentes técnicas de clasificación sobre una base de datos de transacciones en eBay.
- Reglas de asociación: Se investigan reglas de asociación sobre una base de datos de préstamos bancarios.
El tema del trabajo teórico es Support Vector Machines (SVM), realizado por Pablo Alfaro Goicoechea, Carlos Santiago Sánchez Muñoz y por mi, Carlos Morales Aguilera.
Las máquinas de vectores de soporte (del inglés Support Vector Machines, SVM) sonun conjunto de algoritmos de aprendizaje supervisado desarrollados por Vladimir Vapniky su equipo en los laboratorios AT&T.
Esta técnica está pensada con problemas de clasificación y regresión. Dado un conjuntode ejemplos de entrenamiento podemos etiquetar las clases y entrenar SVM para construirun modelo que prediga la clase de una nueva muestra. Intuitivamente, SVM es un modeloque representa a los puntos de muestra en el espacio, separando las clases a 2 espacios lomás amplios posibles mediante un hiperplano de separación definido como el vector entrelos 2 puntos, de las 2 clases, más cercanos al que se llama vector soporte. Cuando lasnuevas muestras se ponen en correspondencia con dicho modelo, en función de los espaciosa los que pertenezcan, pueden ser clasificadas a una o la otra clase.
Más formalmente, SVM construye un hiperplano o conjunto de hiperplanos en un espa-cio de dimensionalidad muy alta (o incluso infinita) que puede ser utilizado en problemasde clasificación o regresión. Una buena separación entre las clases permitirá una clasifica-ción correcta.En este trabajo se intentará dar una idea de qué problemas puede SVM resolver congarantías y algunas aplicaciones actuales de dicha técnica.
El tema del trabajo práctico es Contraconceptive Method Choice. El enlace se puede ver en Kaggle.
Encuesta de 1987 en Indonesia acerca del método anticonceptivo escogido por las mujeres. Factores: educación de los integrantes del matrimonio, orientación religiosa, familia y otros.
El interés parte en el artículo A Comparison of Prediction Accuracy, Complexity, and Training Time of Thirty-Three Old and New Classification Algorithms.