Skip to content

Latest commit

 

History

History
35 lines (31 loc) · 5.32 KB

README.md

File metadata and controls

35 lines (31 loc) · 5.32 KB

Примеры дашбордов (Yandex DataLens)

  1. Исследование посещаемости занятий в онлайн-школе
  2. Исследование регионов заказа и доставки товаров

Онлайн-магазин Y предоставил выгрузку из своего хранилища данных (источник). На основе полученной информации были проведены следующие процедуры, позволившие выявить закономерности в поведении клиентов магазина:

  • Расчет общего, ежемесячного и среднего за неделю в разбивке по месяцам количества покупок, совершенных каждым пользователем.
  • Анализ динамики продаж по дням недели.
  • Классификация и анализ недоставленных заказов.
  • Когортный анализ метрики retention.
  • RFM-анализ.

Стек

Python: numpy, pandas, scipy, matplotlib, seaborn, requests, sys, datetime.

В некоторый момент времени пользователи онлайн-платформы Х были случайным образом распределены либо в контрольную группу A, либо в целевую группу B. Затем в течение неназванного периода наблюдения при оформлении покупки на сайте пользователям из группы A предлагалось воспользоваться базовой механикой оплаты, а членам группы B — обновлённой. Все релевантные взаимодействия участников эксперимента с сайтом были записаны в .csv-таблицы. На базе этого набора данных (источник) была сделана оценка целесообразности развертывания новой механики оплаты на всех нынешних и будущих пользователей платформы.

Стек

Python: numpy, pandas, scipy, pingouin, matplotlib, seaborn, requests.

Команда образовательной платформы Х собрала информацию для A/B-тестирования нового экрана оплаты услуг на сайте и на её основе создала реляционную базу данных, управляемую системой Clickhouse (источник). С помощью SQL-запросов к базе данных было найдено количество усердных студентов ^{1}$, а также рассчитаны следующие продуктовые метрики для контрольной и пилотной групп:

  • средний доход с пользователя (ARPU);
  • средний доход с платящего пользователя (ARPPU);
  • средний доход с активного пользователя $^{2}$ (ARPАU);
  • коэффициент конверсии пользователей в покупку (CR);
  • коэффициент конверсии активных пользователей в покупку (CR_active);
  • коэффициент конверсии пользователей, проявлявших активность в курсе математики $^{3}$, в покупку этого курса (CR_math_active).

$^{1}$Усердный студент – это такой пользователь платформы, что хотя бы один раз правильно решил 20 и более заданий за месяц.
$^{2}$Активным считается пользователь, за все время решивший правильно более 10 любых задач.
$^{3}$Активным по математике считается пользователь, который за все время правильно решил две или более задачи в курсе математики.

Стек

Clickhouse: группировка, агрегирование и фильтрация данных, подзапросы, объединение таблиц, логические выражения, задание алиасов.
Python: pandahouse, pandas, numpy.