Ended 3 years ago
223 participants
288 submissions

Materials (4,489 MB)

Download all materials
train_transactions_contest
2,737 MB
test_transactions_contest
1,731 MB
train_target.csv
10 MB
test_target_contest.csv
5 MB
sample_submission.csv
6 MB

Участникам предлагается оценить вероятность того, что клиент выйдет в дефолт, основываясь на истории потребительского поведения по карточным транзакциям.

Подробное описание данных
1. train_transactions_contest/test_transactions_contest - тренировочная и тестовая выборки с транзакционными данными. Файлы в данных папках разбиты по партициям и сохранены в формате parquet. Подробное описание полей:

  • app_id - Идентификатор заявки. Заявки пронумерованы так, что более поздним заявкам соответствует более поздняя дата
  • amnt - Нормированная сумма транзакции. 0.0 - соответствует пропускам
  • currency - Идентификатор валюты транзакции
  • operation_kind - Идентификатор типа транзакции
  • card_type - Уникальный идентификатор типа карты
  • operation_type - Идентификатор типа операции по пластиковой карте
  • operation_type_group - Идентификатор группы карточных операций, например, дебетовая карта или кредитная карта
  • ecommerce_flag - Признак электронной коммерции
  • payment_system - Идентификатор типа платежной системы
  • income_flag - Признак списания/внесения денежных средств на карту
  • mcc - Уникальный идентификатор типа торговой точки
  • country - Идентификатор страны транзакции
  • city - Идентификатор города транзакции
  • mcc_category - Идентификатор категории магазина транзакции
  • day_of_week - День недели, когда транзакция была совершена
  • hour - Час, когда транзакция была совершена
  • days_before - Количество дней до даты выдачи кредита
  • weekofyear - Номер недели в году, когда транзакция была совершена
  • hour_diff - Количество часов с момента прошлой транзакции для данного клиента
  • transaction_number - Порядковый номер транзакции клиента

2. train_target.csv - целевая переменная выборки для обучения

  • app_id - Идентификатор заявки. заявки пронумерованы так, что более поздним заявкам соответствует более поздняя дата
  • product - Продукт по которому нужно принять решение, уйдет ли заявитель в дефолт или нет
  • flag - Целевая переменная, 1 - факт ухода в дефолт.

3. test_target_contest.csv - выборка для построения прогноза

  • app_id - Идентификатор заявки. заявки пронумерованы так, что более поздним заявкам соответствует более поздняя дата
  • product - Продукт по которому нужно принять решение, уйдет ли заявитель в дефолт или нет

4. sample_submission.csv - пример сабмита

  • app_id - Идентификатор заявки. Заявки пронумерованы так, что более поздним заявкам соответствует более поздняя дата
  • score - предсказание модели.

Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy