Данные проекты были выполнены в ходе обучения в Яндекс.Практикуме профессии "Специалист по Data Science".
Название проекта | Описание | Стек |
---|---|---|
Прогноз стоимости автомобиля | Сервис по продаже автомобилей с пробегом разрабатывает приложение, в котором можно будет узнать стоимость своего автомобиля. Необходимо разработать модель МО для расчета стоимости автомобиля по его признакам. | Python, pandas, matplotlib, LightGBM |
Предсказание уровня удовлетворенности сотрудника и его увольнения | Для снижения финансовых потерь компании и оттока сотрудников необходимо разработать 2 модели МО для предсказания уровня удовлетворённости сотрудников и их возможного увольнения. | Python, pandas, matplotlib, Pipeline, RandomizedSearchCV |
Выявление токсичных комментариев | Интернет-магазин запускает новый сервис, благодаря которому пользователи предлагают свои правки и комментируют изменения других. Необходимо разработать модель МО для выяления токсичных комментариев и отправления их на модерацию. | Python, pandas, nltk, tf-idf |
Анализ продаж видеоигр | Магазину по продаже видеоигр необходимо спрогнозировать продажи на следующий год для эффективного планирования рекламной кампании. Необходимо проанализировать продажи и составить портреты пользователей в Северной Америке, Европе и Японии | Python, pandas, SciPy, matplotlib |
Прогнозирование заказов такси на следующий час | Сервису по заказе такси необходимо разработать модель МО для прогноза заказов такси на следующий час, чтобы привлекать больше водителей в часы пиковой нагрузки. | Python, pandas, scikit-learn, statsmodel, matplotlib |
Предсказание ухода клиента от оператора связи | Для предотвращения оттока клиентов оператору связи необходимо создать модель машинного обучения для предсказания ухода клиента. | Python, pandas, sklearn, seaborn, matplotlib, phik, Pipeline, One-Hot-Encoder, StandardScaler, GridSearchCV, LogisticRegression, CatBoostClassifier, SGDClassifier |
Определение возраста покупателей | Для сетевого супермаркета необходимо создать модель МО для определения возраста покупателей в прикассовой зоне. | Python, pandas, tensorflow, keras, ResNet50, matplotlib. |