Онлайн-магазин Y предоставил выгрузку из своего хранилища данных (источник). На основе полученной информации были проведены следующие процедуры, позволившие выявить закономерности в поведении клиентов магазина:
- Расчет общего, ежемесячного и среднего за неделю в разбивке по месяцам количества покупок, совершенных каждым пользователем.
- Анализ динамики продаж по дням недели.
- Классификация и анализ недоставленных заказов.
- Когортный анализ метрики retention.
- RFM-анализ.
Python: numpy, pandas, scipy, matplotlib, seaborn, requests, sys, datetime.
В некоторый момент времени пользователи онлайн-платформы Х были случайным образом распределены либо в контрольную группу A, либо в целевую группу B. Затем в течение неназванного периода наблюдения при оформлении покупки на сайте пользователям из группы A предлагалось воспользоваться базовой механикой оплаты, а членам группы B — обновлённой. Все релевантные взаимодействия участников эксперимента с сайтом были записаны в .csv-таблицы. На базе этого набора данных (источник) была сделана оценка целесообразности развертывания новой механики оплаты на всех нынешних и будущих пользователей платформы.
Python: numpy, pandas, scipy, pingouin, matplotlib, seaborn, requests.
Команда образовательной платформы Х собрала информацию для A/B-тестирования нового экрана оплаты услуг на сайте и на её основе создала реляционную базу данных, управляемую системой Clickhouse (источник). С помощью SQL-запросов к базе данных было найдено количество усердных студентов ^{1}$, а также рассчитаны следующие продуктовые метрики для контрольной и пилотной групп:
- средний доход с пользователя (ARPU);
- средний доход с платящего пользователя (ARPPU);
- средний доход с активного пользователя
$^{2}$ (ARPАU); - коэффициент конверсии пользователей в покупку (CR);
- коэффициент конверсии активных пользователей в покупку (CR_active);
- коэффициент конверсии пользователей, проявлявших активность в курсе математики
$^{3}$ , в покупку этого курса (CR_math_active).
Clickhouse: группировка, агрегирование и фильтрация данных, подзапросы, объединение таблиц, логические выражения, задание алиасов.
Python: pandahouse, pandas, numpy.