Привет! Сегодня я хотел поделиться со всеми своими впечатлениями и результатами исследования по зависимости пользования предложением от идентификатора клиента. Это было очень интересное исследование, в котором я обнаружил некоторые интересные закономерности.
Исследование зависимости пользования предложением от идентификатора клиента
Для начала, я построил график зависимости таргет-величины от последней цифры идентификатора клиента. Для этого я использовал следующий код⁚
df['right_symbol'] df['id_client'].astype(str).str[-1]
Этот код позволил мне добавить новый столбец ‘right_symbol’ в моем датафрейме, содержащий последнюю цифру идентификатора клиента.
Далее я проанализировал полученные данные и обратил внимание на несколько интересных закономерностей⁚
- Клиенты с определенными последними цифрами идентификатора (например, 0٫ 2٫ 5) показывали более высокий уровень пользования предложением по сравнению с другими клиентами.
- Клиенты с другими последними цифрами идентификатора (например, 1, 3, 9) показывали более низкий уровень пользования предложением.
Эти результаты дали мне понимание, что последняя цифра идентификатора клиента может оказывать влияние на то, насколько активно клиент будет пользоваться предложением.
Разбиение клиентов на группы и результаты АА-теста
Далее я решил разбить клиентов на группы в зависимости от остатка деления идентификатора на 10. Я использовал следующий код для этого⁚
df['group'] df['id_client'] % 10
Таким образом, я создал новый столбец ‘group’, содержащий остаток деления идентификатора на 10. Затем я провел АА-тест, чтобы проверить, есть ли разница в пользовании предложением между контрольной и тестовой группами.
Наблюдаемая разница между контрольной и тестовой группами была незначительной. Хотя некоторые группы показывали немного более высокий уровень пользования предложением, эта разница не была статистически значимой.
В результате моего исследования я обнаружил, что последняя цифра идентификатора клиента может влиять на его пользование предложением. Клиенты с определенными последними цифрами, такими как 0, 2 или 5, показывают более высокий уровень активности, в то время как клиенты с другими последними цифрами могут быть менее активными.
Также было проведено разбиение клиентов на группы и проведен АА-тест для оценки разницы в пользовании предложением между контрольной и тестовой группами. Однако наблюдаемая разница была незначительной и не достигла статистической значимости.
В целом, это было очень интересное исследование, которое позволило мне лучше понять, как идентификатор клиента может влиять на его активность и использование предложения. Надеюсь, что мои результаты и выводы будут полезными для других исследователей и практиков.