Skip to content

Commit 4730839

Browse files
author
Andrey Kulagin
committed
Add initial tracks for Machine Learning skills: Product & Problem Framing, ML Science & Experimentation, Data Engineering, MLOps & Reliability, and Engineering Excellence
1 parent 0c0d58d commit 4730839

File tree

5 files changed

+161
-0
lines changed

5 files changed

+161
-0
lines changed
Lines changed: 33 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,33 @@
1+
# 1. Product & Problem Framing
2+
3+
Этот трек посвящен навыкам определения и формализации бизнес-проблем, их перевода в ML-задачи, а также управлению ML-проектами с фокусом на продуктовое мышление и создание ценности для бизнеса.
4+
5+
## ML1 (Junior)
6+
- Знает базовые бизнес-метрики.
7+
- Знает, какую offline метрику оптимизирует модель и почему она коррелирует с бизнес-метрикой.
8+
- Предлагает способ решения задачи.
9+
10+
## ML2 (Middle)
11+
- Сам переводит абстрактную бизнес-цель в измеримые ML и продуктовые метрики.
12+
- Совместно с PM формулирует user-problem и business objective.
13+
- Ведёт цикл гипотеза → MVP → production
14+
- Учитывает зависимости от других команд (бэкенд, аналитика). Передаёт необходимый контекст по задачам.
15+
16+
## ML3 (Middle +)
17+
- Проактивно предлагает гипотезы для решения бизнес-проблемы
18+
- Умеет считать полный ROI с учетом издержек.
19+
- Видит альтернативы не только в ML (процессы, продуктовые фичи).
20+
- Формулирует, валидирует и приоритизирует гипотезы на основе фреймворков (например, RICE).
21+
- Самостоятельно продумывает полный скоуп задач для аналитиков и разработчиков, инициирует их заведение в бэклог.
22+
23+
## ML4 (Senior)
24+
- Формирует роадмап и набор гипотез по OKR на 1-2 квартала.
25+
- Помогает другим формулировать задачи через призму ценности для бизнеса и пользователя.
26+
- Коучит ML/PM в product & problem framing. Учитывает trade-off'ы между краткосрочным и долгосрочным эффектом.
27+
- Внедряет культуру product-thinking в ML-команду.
28+
- Настраивает процессы постановки задач, чтобы нужные действия от аналитиков и разработчиков происходили своевременно.
29+
30+
## ML5 (Staff)
31+
- Формирует ML-стратегию, питчит ее CTO / CDO
32+
- Инициирует масштабные продуктовые изменения и эксперименты, влияющие на стратегию компании.
33+
- Строит системные процессы взаимодействия с другими функциями
Lines changed: 31 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,31 @@
1+
# 2. ML Science & Experimentation
2+
3+
Этот трек фокусируется на глубоких знаниях в области машинного обучения, от исследования и выбора подходящих алгоритмов до проведения и анализа A/B тестов, а также на способности критически оценивать и улучшать ML-модели.
4+
5+
## ML1 (Junior)
6+
- Работает над ML-моделями, адаптируя существующие туториалы/гайды
7+
- Проводит EDA для нового датасета, формулирует выводы о качестве данных и применимости тех или иных ML-моделей
8+
- Самостоятельно делает feature engineering — простые преобразования, отбор фичей.
9+
- Визуализиует датасеты и результаты так, чтобы выводы понял даже не-технический специалист.
10+
- Перед тем как решать задачу проводит literature review существующих решений.
11+
12+
## ML2 (Middle)
13+
- Строит каскад метрик от бизнес-метрик к DS-метрикам и loss-ам в ML-дизайне и умеет объяснить связь
14+
- Эффективно работает с инструментами и ML-библиотеками, используемыми в команде; дорабатывает общие библиотеки
15+
- Всегда начинает с простых бейзлайнов.
16+
- Проводит анализ ошибок модели, формулирует гипотезы для будущих итераций улучшения
17+
- Способен подготовить и корректно проанализировать A/B-тест, для неочевидных результатов проводит постанализ
18+
19+
## ML3 (Middle +)
20+
- Знаком и работал с целой палитрой ML-алгоритмов, обоснованно выбирает подходящее решение, подсвечивая trade-off-ы.
21+
- Анализирует и представляет результаты экспериментов с корректными статистическими методами и визуализациями; оцениваю статистическую точность выводов команды.
22+
- Определяет и отслеживает оффлайн- и онлайн-метрики для достижения бизнес-целей.
23+
24+
## ML4 (Senior)
25+
- Критикует существующие метрики и определяет новые оффлайн/онлайн-метрики, актуальные на всём жизненном цикле модели.
26+
- Отвечает за стратегию экспериментов команды и актуализирует её по важным находкам.
27+
- Предоставляет критическую обратную связь другим членам команды на всех стадиях ML-проекта.
28+
29+
## ML5 (Staff)
30+
- Управляет портфелем ML-исследований, балансируя риски и ценность, и приоритизируя инвестиции.
31+
- Определяет и поддерживаю организационную стратегию ML-экспериментов: единые шаблоны дизайна, метрик и отчётности.
Lines changed: 32 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,32 @@
1+
# 3. Data Engineering
2+
3+
Этот трек охватывает навыки, связанные с построением и поддержкой надежных и масштабируемых пайплайнов данных, от написания сложных SQL-запросов до проектирования архитектуры данных и работы с batch и stream обработкой.
4+
5+
## ML1 (Junior)
6+
- Понимает базовые концепции работы с БД
7+
- Может делать простые SQL запросы для выгрузки данных
8+
- Умеет создавать и настраивает простые ETL пайплайны
9+
- Понимает важность качества данных и проверяет данные на очевидные ошибки и аномалии
10+
- Работает с миграциями совместно со старшим инженером в команде: создает новые таблицы/модифицирует старые при необходимости
11+
12+
## ML2 (Middle)
13+
- Уверенно пишет сложные SQL запросы и оптимизирует их при необходимости
14+
- Реализовывает и поддерживает сложные ETL пайплайны(включает сложные преобразования, зависимость с другими ETL)
15+
- Внедряет базовые проверки качества данных, пишет тесты
16+
- Разбирается с инцидентами в данных, исправляет важные пайплайны без длительного даунтайма
17+
- Может обрабатывать данные с помощью Spark на начальном уровне
18+
- Самостоятельно работает с миграциями: создает новые таблицы/модифицирует старые при необходимости
19+
20+
## ML3 (Middle +)
21+
- Лидирует небольшие дата проекты в рамках своих задач: проектирует end-to-end пайплайны под новую ML задачу. Оценивает трудоемкость и риски.
22+
- Может делать сложные преобразования данных с помощью Spark
23+
- Настраивает и оптимизирует схемы хранения данных в рамках ЗО(подбирает PARTITION BY и ORDER BY под реальные паттерны запросов, настраивает TTL-политики итп)
24+
25+
## ML4 (Senior)
26+
- Проектирует масштабируемую архитектуру для обработки данных в рамках команды/ в рамках нескольких команд
27+
- Может комбинировать batch и stream пайплайны
28+
- Лидирует дата проекты в рамках функции
29+
- Создает и настраивает процессы связанные с обработкой данных и последующим мониторингом.
30+
31+
## ML5 (Staff)
32+
- ...
Lines changed: 28 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,28 @@
1+
# 4. MLOps & Reliability
2+
3+
Этот трек посвящен практикам MLOps и обеспечения надежности ML-систем. Он включает в себя навыки по контейнеризации, развертыванию моделей как сервисов, настройке CI/CD, мониторингу и оптимизации производительности.
4+
5+
## ML1 (Junior)
6+
- Верхнеуровнево понимает принципы работы контейниризации.
7+
- Для сборки образа и других сложных операций обращается к старшим инженерам.
8+
9+
## ML2 (Middle)
10+
- Может уже самостоятельно запускать модель как REST API (FastAPI/Flask).
11+
- Хорошо понимает, как работает Docker, может самостоятельно пересобрать необходимый образ для кастомной таски.
12+
- Мониторинг сдвига данных на train/inference
13+
- Для развертывания сервиса и настройки к CI/CD обращается к DevOps.
14+
15+
## ML3 (Middle +)
16+
- Оценивает latency и throughput сервиса
17+
- Может с высокой точностью оценить trade off между value от модели и стоимостью деплоя.
18+
- Самостоятельно может создать базы, провести необходимые миграции для деплоя сервиса (создание переменных окружения, расположить их в Drone и тд)
19+
- Строит с дашборд с метриками сервиса
20+
- Самостоятельно настраивает CI/CD
21+
22+
## ML4 (Senior)
23+
- Проектирует и внедряет сложные ML-системы, которые работают стабильно под высокой нагрузкой.
24+
- Самостоятельно настраивает CI/CD не только для моделей, но и A/B-тесты, автоматический откат при дрейфе
25+
- Глубоко разбирается в Kubernetes — оптимизирует ресурсы настраивает сетевые политики и балансировку.
26+
27+
## ML5 (Staff)
28+
- Определяет, какие инструменты использовать на уровне компании
Lines changed: 37 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,37 @@
1+
# 5. Engineering Excellence
2+
3+
Этот трек посвящен инженерной культуре и качеству кода. Он включает в себя принципы написания чистого, поддерживаемого и расширяемого кода, воспроизводимость исследований, проведение code-review, документирование и распространение лучших практик.
4+
5+
## ML1 (Junior)
6+
- Исследования всегда полностью воспроизводимы, random-seed зафиксирован, логи и параметры обучения сохранены.
7+
- Использует Git в работе, понимает, как с ним работать.
8+
- Воплощает идеи в понятный код, написанный так, чтобы его можно было и выполнить, и прочесть.
9+
- Умеет читать и ориентироваться в функциях и модулях, которые не писал сам.
10+
- В его коде отсутствуют бросающиеся в глаза ошибки; замечания по оформлению сведены к минимуму, код задокументирован и протестирован.
11+
- Участвует в code-review как второй ревьюер, задаёт вопросы, помогающие изучать базу кода и технологии.
12+
- Выделяет небольшие переиспользуемые модули, соблюдая принцип разделения ответственности.
13+
- Использует Gen AI для написания кода
14+
15+
## ML2 (Middle)
16+
- Запрашивает и проводит ML-дизайн-ревью
17+
- Проектирует и пишет код, который легко расширять; применяет общепринятые паттерны и SOLID-принципы.
18+
- Выступает основным reviewer, учитывает разные мнения и проходит ревью без критических замечаний.
19+
- Контролирует работу решения в проде, используя логи и мониторинг; заводит задачи на рефакторинг, следует «правилу бойскаута».
20+
- Создаёт RFC / дизайн-заметки и вносит улучшения в документацию команды.
21+
22+
## ML3 (Middle +)
23+
- В ML Design Review задает проницательные вопросы, подтверждает выбор или вскрывает ошибочные предположения.
24+
- Пишет библиотеки/модули, которые расширяются другими командами; описывает их в технической документации.
25+
- Принимает архитектурные решения, валидирует чужие RFC и знает, когда нужен существенный рефакторинг.
26+
- Закрывает технический долг и публикует постмортемы с Root cause analysis и action-items.
27+
- Делится своими знаниями с коллегами, которые те впоследствии используют
28+
29+
## ML4 (Senior)
30+
- Изучает технические решения схожих проблем в других направлениях и/или компаниях
31+
- При применении новых технологий критически оценивает их пользу и применимость в проекте - делает сравнительный анализ (например, SWOT)
32+
- Отвечает за ключевые сервисы команды. Проактивно ищет неэффективные места в коде/архитектуре/инфраструктуре
33+
- Обучает других иженеров в своей команде или кластере. Распространяет лучшие практики через внутренние гильдии, воркшопы, статьи.
34+
- Ведет техническую документацию по сервисам команды.
35+
36+
## ML5 (Staff)
37+
- Влияет на общую data-driven культуру в компании через продвижение лучших технических практик и менторство.

0 commit comments

Comments
 (0)