train_transactions_contest | 2,737 MB | |
test_transactions_contest | 1,731 MB | |
train_target.csv | 10 MB | |
test_target_contest.csv | 5 MB | |
sample_submission.csv | 6 MB |
Участникам предлагается оценить вероятность того, что клиент выйдет в дефолт, основываясь на истории потребительского поведения по карточным транзакциям.
Подробное описание данных
1. train_transactions_contest/test_transactions_contest
- тренировочная и тестовая выборки с транзакционными данными. Файлы в данных папках разбиты по партициям и сохранены в формате parquet. Подробное описание полей:
app_id
- Идентификатор заявки. Заявки пронумерованы так, что более поздним заявкам соответствует более поздняя датаamnt
- Нормированная сумма транзакции. 0.0 - соответствует пропускамcurrency
- Идентификатор валюты транзакцииoperation_kind
- Идентификатор типа транзакцииcard_type
- Уникальный идентификатор типа картыoperation_type
- Идентификатор типа операции по пластиковой картеoperation_type_group
- Идентификатор группы карточных операций, например, дебетовая карта или кредитная картаecommerce_flag
- Признак электронной коммерцииpayment_system
- Идентификатор типа платежной системыincome_flag
- Признак списания/внесения денежных средств на картуmcc
- Уникальный идентификатор типа торговой точкиcountry
- Идентификатор страны транзакцииcity
- Идентификатор города транзакцииmcc_category
- Идентификатор категории магазина транзакцииday_of_week
- День недели, когда транзакция была совершенаhour
- Час, когда транзакция была совершенаdays_before
- Количество дней до даты выдачи кредитаweekofyear
- Номер недели в году, когда транзакция была совершенаhour_diff
- Количество часов с момента прошлой транзакции для данного клиентаtransaction_number
- Порядковый номер транзакции клиента2. train_target.csv
- целевая переменная выборки для обучения
app_id
- Идентификатор заявки. заявки пронумерованы так, что более поздним заявкам соответствует более поздняя датаproduct
- Продукт по которому нужно принять решение, уйдет ли заявитель в дефолт или нетflag
- Целевая переменная, 1 - факт ухода в дефолт.3. test_target_contest.csv
- выборка для построения прогноза
app_id
- Идентификатор заявки. заявки пронумерованы так, что более поздним заявкам соответствует более поздняя датаproduct
- Продукт по которому нужно принять решение, уйдет ли заявитель в дефолт или нет4. sample_submission.csv
- пример сабмита
app_id
- Идентификатор заявки. Заявки пронумерованы так, что более поздним заявкам соответствует более поздняя датаscore
- предсказание модели.Cookies help us deliver our services. By using our services, you agree to our use of cookies.