Causal ML — это библиотека на Python с функционалом для uplift-моделирования и поиска причинно-следственных связей в моделях. Библиотека имеет стандартный интерфейс, который позволяет пользователю оценить Conditional Average Treatment Effect (CATE) или Individual Treatment Effect (ITE) на экспериментальных или реальных данных. Эти методы оценивают каузальное влияния параметра T на целевое значение Y для пользователей с набором параметров X. Никаких предположений по поводу типа модели не делается.
Зачем нужно искать каузальные связи
Одним из кейсов использования библиотеки является оптимизация таргетинга рекламы. Важным методом увеличения ROI рекламной кампания является показ рекламы потребителям, которые будут в ней заинтересованы и кликнут на рекламу. CATE определяет этих потенциальных потребителей с помощью оценки эффекта KPI метрики показа рекламы на пользователях с разным набором параметров. Данные о пользователях могут быть результатом A/B тестирования или историческими наблюдаемыми данными.
Другим примером использования библиотеки является персонализированное вовлечение потребителей. Например, у компании есть множество опций взаимодействия со своими потребителями. CATE оценивает однородность эффекта методов коммуникации для каждого пользователя. Алгоритм можно использовать для ранжирования предпочитаемых способов коммуникации для определенного клиента и коммуницировать с клиентами персонализировано.
Доступный функционал библиотеки
Библиотека на данный момент поддерживает следующие алгоритмы:
- Алгоритмы, основанные на деревьях;
- Uplift дерево и случайный лес с расстоянием Кульбака-Лейблера, Евклидовым расстоянием и Хи-квадрат;
- Uplift дерево и случайный лес, которые базируются на Contextual Treatment Selection;
- Алгоритмы мета-обучения: S-learner, T-learner, X-learner, R-learner