Участникам необходимо решить Time-to-Event задачу предсказания оттока клиентов банка на основе истории их транзакций.
Нажимая кнопку «Участвовать» и/или «Отправить решение», вы соглашаетесь с Правилами участия в соревновании Data Fusion Contest 2024.
Необходимо решить задачу предсказания оттока клиентов банка. А именно, используя данные транзакций за 6 месяцев, требуется построить алгоритм, предсказывающий вероятность оттока клиента в следующие 6 месяцев. Особенностью задачи является то, что в рамках тренировочных данных для обучения, участникам передается не только метка, соответствующая тому, что клиент “уйдёт в отток”, но и время до его последней транзакции. Подробнее про структуру и особенности данных можно узнать на странице “Данные”.
Предсказание оттока клиентов это крайне распространенная задача, встречающаяся в множестве компаний в самых разных индустриях. Несмотря на свою широкую распространенность, в задачах оттока есть большое количество подводных камней и особенностей, о которых часто говорят, но практически никогда не показывают на практике. С другой стороны, в задачах оттока имеется множество полезных наработок, аналитических практик и целых научных направлений, о которых мало кто знает за пределами практикующих экспертных команд.
В рамках этого соревнования участники могут подойти к решению задачи большим количеством способов. В частности, наличие в рамках обучающих данных такой информации, как время до последней транзакции, позволит участникам воспользоваться Time-to-Event подходами в машинном обучении.
Это табличное соревнование с разметкой предоставленного вам .csv файла. Вам необходимо создать алгоритм, способный по предоставленным в рамках соревнования данным, создать новый табличный .csv файл с двумя столбцами:
user_id, predict
9, -3.1415926
61, -1.7320508
...
562205, 2.718282
Здесь user_id
– идентификатор клиентов банка, predict
– предсказание вашего алгоритма. Предсказания необходимо построить для всех 32,000 клиентов из тестовых данных. Примеры sample_submission.csv
доступны на странице “Данные”.
CI
, также известная как Concordance Index или (Harrel's) C-index. Для тех, кто впервые сталкивается с этой метрикой, на нее стоит смотреть как на обобщение ROC-AUC для Time-to-Event задач. В соревновании используется реализация подсчета метрики из библиотеки lifelines
: lifelines.utils.concordance_index. max(CI, 1 - CI)
.1 место: 500 000 рублей
2 место: 250 000 рублей
3 место: 150 000 рублей
Номинация Companion по задаче Отток:
50 000 рублей (по состоянию на “экватор” соревнования)
50 000 рублей (после дедлайна соревнования)
Как вы уже, наверное, догадались, это соревнование — площадка для освоения и испытаний Time-to-Event подходов в машинном обучении. Чтобы вы могли погрузиться в эту область, а также вдохновиться подходами и идеями, хотим поделиться с вами наиболее интересными материалами по теме, отобранными в ходе подготовки соревнования.
Cookies help us deliver our services. By using our services, you agree to our use of cookies.