Evaluación de Modelos de Machine Learning para Clasificación de Sentimientos: Un Enfoque Comparativo
Este proyecto forma parte del bootcamp Talento Tech y tiene como objetivo la creación y evaluación de diferentes modelos de machine learning para la clasificación de sentimientos en comentarios de diversas redes sociales. El propósito es comparar la eficacia de estos modelos en la predicción del análisis de sentimientos.
- Desarrollar varios modelos de machine learning para la clasificación de sentimientos.
- Evaluar y comparar la precisión y eficacia de cada modelo.
- Analizar los resultados y determinar el modelo más efectivo para la tarea de clasificación de sentimientos.
- Construcción del dataset: Obtención de comentarios de diferentes redes sociales (Kaggle datasets).
- Traducción de Comentarios: Traducción de los comentarios a Español para unificar el idioma.
- NLP (Procesamiento de Lenguaje Natural): Limpieza y preparación de los datos para su uso en modelos de machine learning..
- Word Embeddings: Creación de vectores de palabras para representar los comentarios.
- Dataset con Word Embeddings: Creación de un dataset con los vectores de palabras y las etiquetas de sentimiento. (200 dimensiones son columnas, 1 columna para la etiqueta de sentimiento).
- Desarrollo de Modelos: Creación de varios modelos de machine learning, incluyendo pero no limitado a:
- Regresión Logística
- Máquinas de Soporte Vectorial (SVM)
- Redes Neuronales
- Árboles de Decisión y Bosques Aleatorios
- Evaluación de Modelos: Uso de métricas de evaluación como precisión, recall, F1-score y AUC-ROC para comparar los modelos.
- Análisis de Resultados: Interpretación de los resultados y selección del modelo más eficaz.
- Python 3.x
- Bibliotecas de Python:
- pandas
- numpy
- scikit-learn
- nltk
- matplotlib
- seaborn
Las versiones específicas de las bibliotecas se pueden encontrar en el archivo requirements.txt.