Для решения образовательной задачи “distribution” предлагается несколько групп данных и материалов.
82.3KB, сопроводительный ноутбук для базового решения submit_baseline_catboost.csv
Для обучения моделей участникам представляются 4 файла с различными группами признаков для моделирования.
В качестве ключа для объединения данных выступает идентификатор клиента user_id
.
140.0MB, дополнительные признаки по картам и категориям трат (630 признаков)
119.5MB, дополнительные признаки сумм и счетчиков по MCC кодам (1640 признаков)
829.3MB, дополнительные признаки предпочтений клиентов на основе MCC (2112 признаков)
Аналогичные 4 файла, необходимые для подготовки предсказаний:
202.3MB, тестовые данные дополнительных признаков по картам и категориям трат
170.8MB, тестовые данные дополнительных признаков сумм и счетчиков по MCC кодам
1.2GB, тестовые данные дополнительных признаков предпочтений клиентов на основе MCC
Для каждого файла с группами признаков доступен словарь обозначений и описаний входящих в файл признаков:
142.0KB, глоссарий для дополнительной группы признаков по картам и категориям трат (630)
418.5KB, глоссарий дополнительных признаков сумм и счетчиков по MCC кодам (1640)
689.8KB, глоссарий дополнительных признаков предпочтений клиентов на основе MCC (2112)
Cookies help us deliver our services. By using our services, you agree to our use of cookies.