train_transactions_contest | 2,737 MB | |
test_transactions_contest | 1,731 MB | |
train_target.csv | 10 MB | |
test_target_contest.csv | 5 MB | |
sample_submission.csv | 6 MB |
Участникам предлагается оценить вероятность того, что клиент выйдет в дефолт, основываясь на истории потребительского поведения по карточным транзакциям.
Подробное описание данных
1. train_transactions_contest/test_transactions_contest
- тренировочная и тестовая выборки с транзакционными данными. Файлы в данных папках разбиты по партициям и сохранены в формате parquet. Подробное описание полей:
app_id
- Идентификатор заявки. Заявки пронумерованы так, что более поздним заявкам соответствует более поздняя датаamnt
- Нормированная сумма транзакции. 0.0 - соответствует пропускамcurrency
- Идентификатор валюты транзакцииoperation_kind
- Идентификатор типа транзакцииcard_type
- Уникальный идентификатор типа картыoperation_type
- Идентификатор типа операции по пластиковой картеoperation_type_group
- Идентификатор группы карточных операций, например, дебетовая карта или кредитная картаecommerce_flag
- Признак электронной коммерцииpayment_system
- Идентификатор типа платежной системыincome_flag
- Признак списания/внесения денежных средств на картуmcc
- Уникальный идентификатор типа торговой точкиcountry
- Идентификатор страны транзакцииcity
- Идентификатор города транзакцииmcc_category
- Идентификатор категории магазина транзакцииday_of_week
- День недели, когда транзакция была совершенаhour
- Час, когда транзакция была совершенаdays_before
- Количество дней до даты выдачи кредитаweekofyear
- Номер недели в году, когда транзакция была совершенаhour_diff
- Количество часов с момента прошлой транзакции для данного клиентаtransaction_number
- Порядковый номер транзакции клиента2. train_target.csv
- целевая переменная выборки для обучения
app_id
- Идентификатор заявки. заявки пронумерованы так, что более поздним заявкам соответствует более поздняя датаproduct
- Продукт по которому нужно принять решение, уйдет ли заявитель в дефолт или нетflag
- Целевая переменная, 1 - факт ухода в дефолт.3. test_target_contest.csv
- выборка для построения прогноза
app_id
- Идентификатор заявки. заявки пронумерованы так, что более поздним заявкам соответствует более поздняя датаproduct
- Продукт по которому нужно принять решение, уйдет ли заявитель в дефолт или нет4. sample_submission.csv
- пример сабмита
app_id
- Идентификатор заявки. Заявки пронумерованы так, что более поздним заявкам соответствует более поздняя датаscore
- предсказание модели.Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy