Для данных онлайн-магазина (источник) были найдены ответы на следующие вопросы и реализованы следующие процедуры:
- Сколько пользователей совершили покупку только один раз?
- Сколько заказов в среднем не доставляется за месяц?
- Для каждого товара определить, в какой день недели он покупается чаще всего.
- Для каждого пользователя определить среднее количество покупок в неделю с разбивкой по месяцам.
- Разделить пользователей, совершивших покупки в 2017 году, на когорты по месяцам. Найти когорту с самым высоким показателем retention на 3-й месяц.
- Выполнить RFM-сегментацию пользователей и провести качественную оценку аудитории.
Python: numpy, pandas, scipy, matplotlib, seaborn, requests, sys, datetime.
В некоторый момент времени пользователи образовательной онлайн-платформы Х были случайным образом распределены либо в контрольную группу A, либо в целевую группу B. Затем в течение неназванного периода наблюдения при оформлении покупки на сайте пользователям из группы A предлагалось воспользоваться базовой механикой оплаты, а членам группы B — обновлённой. Все релевантные взаимодействия участников эксперимента с сайтом были записаны в .csv-таблицы. На базе этого набора данных (источник) была сделана оценка целесообразности развертывания новой механики оплаты на всех нынешних и будущих пользователей платформы.
Python: numpy, pandas, scipy, pingouin, matplotlib, seaborn, requests.
Команда образовательной платформы Х собрала информацию для A/B-тестирования нового экрана оплаты услуг на сайте и на её основе создала реляционную базу данных, управляемую системой Clickhouse (источник).
Было найдено количество усердных студентов
- средний доход с пользователя (ARPU);
- средний доход с платящего пользователя (ARPPU);
- средний доход с активного пользователя
$^{2}$ (ARPАU); - коэффициент конверсии пользователей в покупку (CR);
- коэффициент конверсии активных пользователей в покупку (CR_active);
- коэффициент конверсии пользователей, проявлявших активность в курсе математики
$^{3}$ , в покупку этого курса (CR_math_active).
Clickhouse: группировка, агрегирование и фильтрация данных, подзапросы, объединение таблиц, логические выражения, задание алиасов.
Python: pandahouse, pandas, numpy.