|
| 1 | +# 3. SQL • ClickHouse • Trino |
| 2 | + |
| 3 | +Этот трек посвящен навыкам работы с SQL, включая написание сложных запросов, оптимизацию производительности и администрирование баз данных, таких как ClickHouse и Trino. |
| 4 | + |
| 5 | +## DE1 (Junior) |
| 6 | +- Я пишу SELECT с фильтрацией, агрегацией и JOIN, CTE, window functions и аналитическими функциями. |
| 7 | +- Я понимаю основные типы данных, первичные/внешние ключи и разницу OLTP vs OLAP. |
| 8 | +- Я создаю таблицы, индексы и партиционирую данные в Clickhouse и Trino. |
| 9 | +- Я понимаю уровни изоляции транзакций и нормальные формы (1NF‑3NF). |
| 10 | +- Я выполняю распределённые запросы через несколько источников, используя существующие каталоги. |
| 11 | + |
| 12 | +## DE2 (Middle) |
| 13 | +- Я создаю MergeTree‑таблицы, задаю primary key, partition key, TTL и понимаю процесс merges в Clickhouse |
| 14 | +- Я настраиваю каталоги в Trino |
| 15 | +- Я читаю system-таблицы и логи для анализа «узких мест» (дисковое I/O, merges, пробки по памяти). |
| 16 | +- Я использую Trino как слой федерации: соединяет данные из S3 + ClickHouse, делает CTAS или INSERT INTO в Iceberg. |
| 17 | + |
| 18 | +## DE3 (Middle +) |
| 19 | +- Я оптимизирую схемы (LowCardinality, Sparse columns), создаю Materialized Views и Replacing/Collapsing MergeTree; настраиваю TTL‑политику, агрегирующие витрины в Clickhouse |
| 20 | +- Я знаю основные показатели кластера ClickHouse (Query, Merge, Parts, Mutation) и Trino (CPU time, blocked time, GC) и могу оперативно диагностировать 90 % типичных проблем (disk-bound merge, spill-to-disk, out-of-memory). |
| 21 | +- Я понимаю влияние типов данных и преобразований на производительность, избегаю неявных кастов. |
| 22 | + |
| 23 | +## DE4 (Senior) |
| 24 | +- Я проектирую физические модели хранения под SLA запросов (hot/cold слои, сортировка, партиционирование). |
| 25 | +- Я анализирую cost‑based plan, использую session properties и Iceberg connector для оптимизации запросов. |
| 26 | +- Я умею читать основные показатели кластера Clickhouse, могу выявить любую проблему, вычислить корневую причину и предложить ряд действий для решения проблемы. Я точечно реагирую и выделяю слабое место в работе кластера |
| 27 | + |
| 28 | +## DE5 (Staff) |
| 29 | +- Я настраиваю и управляю кластерами ClickHouse (репликация, шардирование, балансировка нагрузки, backup/restore) и Trino (coordinator/worker topology, resource groups, HA). |
| 30 | +- Я читаю и анализирую changelog и release‑notes ClickHouse/Trino, планирую безопасные апгрейды и тестирую миграции. |
| 31 | +- Я формирую корпоративную стратегию ClickHouse/Trino: стандарты апгрейдов, capacity‑planning, FinOps и governance каталога данных. |
| 32 | +- Я разрабатываю DR‑планы, multi‑DC репликацию и сквозное шифрование. |
| 33 | +- Я автоматизирую миграции схем и версионирование данных. |
| 34 | +- Я веду R&D новых движков и PoC, оцениваю ROI их внедрения. |
| 35 | +- Я обучаю продуктовые команды оптимизации затрат на хранение и вычисления и провожу архитектурные ревью. |
0 commit comments