Ends in 1 month
96 participants
60 submissions

Materials (4,489 MB)

Download all materials
train_transactions_contest
2,737 MB
test_transactions_contest
1,731 MB
train_target.csv
10 MB
test_target_contest.csv
5 MB
sample_submission.csv
6 MB

Участникам предлагается оценить вероятность того, что клиент выйдет в дефолт, основываясь на истории потребительского поведения по карточным транзакциям.

Подробное описание данных
1. train_transactions_contest/test_transactions_contest - тренировочная и тестовая выборки с транзакционными данными. Файлы в данных папках разбиты по партициям и сохранены в формате parquet. Подробное описание полей:

  • app_id - Идентификатор заявки. Заявки пронумерованы так, что более поздним заявкам соответствует более поздняя дата
  • amnt - Нормированная сумма транзакции. 0.0 - соответствует пропускам
  • currency - Идентификатор валюты транзакции
  • operation_kind - Идентификатор типа транзакции
  • card_type - Уникальный идентификатор типа карты
  • operation_type - Идентификатор типа операции по пластиковой карте
  • operation_type_group - Идентификатор группы карточных операций, например, дебетовая карта или кредитная карта
  • ecommerce_flag - Признак электронной коммерции
  • payment_system - Идентификатор типа платежной системы
  • income_flag - Признак списания/внесения денежных средств на карту
  • mcc - Уникальный идентификатор типа торговой точки
  • country - Идентификатор страны транзакции
  • city - Идентификатор города транзакции
  • mcc_category - Идентификатор категории магазина транзакции
  • day_of_week - День недели, когда транзакция была совершена
  • hour - Час, когда транзакция была совершена
  • days_before - Количество дней до даты выдачи кредита
  • weekofyear - Номер недели в году, когда транзакция была совершена
  • hour_diff - Количество часов с момента прошлой транзакции для данного клиента
  • transaction_number - Порядковый номер транзакции клиента

2. train_target.csv - целевая переменная выборки для обучения

  • app_id - Идентификатор заявки. заявки пронумерованы так, что более поздним заявкам соответствует более поздняя дата
  • product - Продукт по которому нужно принять решение, уйдет ли заявитель в дефолт или нет
  • flag - Целевая переменная, 1 - факт ухода в дефолт.

3. test_target_contest.csv - выборка для построения прогноза

  • app_id - Идентификатор заявки. заявки пронумерованы так, что более поздним заявкам соответствует более поздняя дата
  • product - Продукт по которому нужно принять решение, уйдет ли заявитель в дефолт или нет

4. sample_submission.csv - пример сабмита

  • app_id - Идентификатор заявки. Заявки пронумерованы так, что более поздним заявкам соответствует более поздняя дата
  • score - предсказание модели.