Семинар 1. Введение. Постановка задачи машинного обучения и анализа данных. Современные инструменты и пакеты для анализа данных. Основы языка Python. Встроенные типы данных. Условный оператор.
Семинар 2. Контейнеры. Списки, сортировка списков. Функции. Рекурсия. Разбор алгоритмических задач на Python. Работа с исключениями. Регулярные выражения. Функциональное программирование в Python: lambda, zip, filter, map reduce.
Семинар 3-4 . Специализированные библиотеки Python для численных методов и анализа данных. Библиотека NumPy. Библиотека SciPY. Решение дифференциальных уравнений с помощью Python. Ускорение кода с помощью библиотек Theano и TensorFlow. Первичный анализ данных с Pandas и визуализация с помощью библиотек Seaborn/Matplotlib/Plotly.
Семинар 5. Линейный модели. Линейная регрессия и стохастический градиентный спуск. Логистическая регрессия. Метрики качества. Проблема переобучения. Знакомство со sklearn.
Семинар 6. Метод ближайших соседей. Решающие деревья в задаче классификации и регресии.
Семинар 7. Решающие деревья в задаче классификации и регресии. Композиции: бэггинг, случайный лес.
Семинар 8. Понижение размерности. Матричные разложения. Обучение без учителя: PCA (Метод главных компнент) и кластеризация.
Семинар 9. Градиентный бустинг. Регуляризация деревьев. Библиотека XGBoost.
Семинар 10. Метод обратного распространения ошибки. Нейронные сети.
Семинар 11. Библиотеки TensorFlow/Keras.