Участникам необходимо решить Time-to-Event задачу предсказания оттока клиентов банка на основе истории их транзакций.
Нажимая кнопку «Участвовать» и/или «Отправить решение», вы соглашаетесь с Правилами участия в соревновании Data Fusion Contest 2024.
Необходимо решить задачу предсказания оттока клиентов банка. А именно, используя данные транзакций за 6 месяцев, требуется построить алгоритм, предсказывающий вероятность оттока клиента в следующие 6 месяцев. Особенностью задачи является то, что в рамках тренировочных данных для обучения, участникам передается не только метка, соответствующая тому, что клиент “уйдёт в отток”, но и время до его последней транзакции. Подробнее про структуру и особенности данных можно узнать на странице “Данные”.
Предсказание оттока клиентов это крайне распространенная задача, встречающаяся в множестве компаний в самых разных индустриях. Несмотря на свою широкую распространенность, в задачах оттока есть большое количество подводных камней и особенностей, о которых часто говорят, но практически никогда не показывают на практике. С другой стороны, в задачах оттока имеется множество полезных наработок, аналитических практик и целых научных направлений, о которых мало кто знает за пределами практикующих экспертных команд.
В рамках этого соревнования участники могут подойти к решению задачи большим количеством способов. В частности, наличие в рамках обучающих данных такой информации, как время до последней транзакции, позволит участникам воспользоваться Time-to-Event подходами в машинном обучении.
Это табличное соревнование с разметкой предоставленного вам .csv файла. Вам необходимо создать алгоритм, способный по предоставленным в рамках соревнования данным, создать новый табличный .csv файл с двумя столбцами:
user_id, predict
9, -3.1415926
61, -1.7320508
...
562205, 2.718282
Здесь user_id
– идентификатор клиентов банка, predict
– предсказание вашего алгоритма. Предсказания необходимо построить для всех 32,000 клиентов из тестовых данных. Примеры sample_submission.csv
доступны на странице “Данные”.
CI
, также известная как Concordance Index или (Harrel's) C-index. Для тех, кто впервые сталкивается с этой метрикой, на нее стоит смотреть как на обобщение ROC-AUC для Time-to-Event задач. В соревновании используется реализация подсчета метрики из библиотеки lifelines
: lifelines.utils.concordance_index. max(CI, 1 - CI)
.1 место: 500 000 рублей
2 место: 250 000 рублей
3 место: 150 000 рублей
Номинация Companion по задаче Отток:
50 000 рублей (по состоянию на “экватор” соревнования)
50 000 рублей (после дедлайна соревнования)
Как вы уже, наверное, догадались, это соревнование — площадка для освоения и испытаний Time-to-Event подходов в машинном обучении. Чтобы вы могли погрузиться в эту область, а также вдохновиться подходами и идеями, хотим поделиться с вами наиболее интересными материалами по теме, отобранными в ходе подготовки соревнования.
Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy