Ends in 1 month
225 participants
404 submissions

Materials (407 MB)

Download all materials
train_target.csv
28 MB
test_target.csv
4 MB
train_data
305 MB
test_data
55 MB
description.xlsx
1 MB
sample_submission.csv
14 MB

Описание файлов и полей датасета

1. {train/test}_target.csv – тренировочная и тестовая выборка кредитов:

  • id – идентификатор заявки на кредит
  • flag – целевая переменная, 1 – факт ухода клиента в дефолт (есть только в файле train_target.csv)

2. {train/test}_data – данные кредитных историй для тренировки и обучения модели:

  • id – идентификатор заявки
  • rn – порядковый номер кредитного продукта в кредитной истории
  • pre_since_opened – дней с даты открытия кредита до даты сбора данных
  • pre_since_confirmed – дней с даты подтверждения информации по кредиту до даты сбора данных
  • pre_pterm – плановое количество дней с даты открытия кредита до даты закрытия
  • pre_fterm – фактическое количество дней с даты открытия кредита до даты закрытия
  • pre_till_pclose – плановое количество дней с даты сбора данных до даты закрытия кредита
  • pre_till_fclose – фактическое количество дней с даты сбора данных до даты закрытия кредита
  • pre_loans_credit_limit – кредитный лимит
  • pre_loans_next_pay_summ – сумма следующего платежа по кредиту
  • pre_loans_outstanding – оставшаяся невыплаченная сумма кредита
  • pre_loans_total_overdue – текущая просроченная задолженность
  • pre_loans_max_overdue_sum – максимальная просроченная задолженность
  • pre_loans_credit_cost_rate – полная стоимость кредита
  • pre_loans5 – число просрочек до 5 дней
  • pre_loans530 – число просрочек от 5 до 30 дней
  • pre_loans3060 – число просрочек от 30 до 60 дней
  • pre_loans6090 – число просрочек от 60 до 90 дней
  • pre_loans90 – число просрочек более, чем на 90 дней
  • is_zero_loans_5 – флаг: нет просрочек до 5 дней
  • is_zero_loans_530 – флаг: нет просрочек от 5 до 30 дней
  • is_zero_loans_3060 – флаг: нет просрочек от 30 до 60 дней
  • is_zero_loans_6090 – флаг: нет просрочек от 60 до 90 дней
  • is_zero_loans90 – флаг: нет просрочек более, чем на 90 дней
  • pre_util – отношение оставшейся невыплаченной суммы кредита к кредитному лимиту
  • pre_over2limit – отношение текущей просроченной задолженности к кредитному лимиту
  • pre_maxover2limit – отношение максимальной просроченной задолженности к кредитному лимиту
  • is_zero_util – флаг: отношение оставшейся невыплаченной суммы кредита к кредитному лимиту равняется 0
  • is_zero_over2limit – флаг: отношение текущей просроченной задолженности к кредитному лимиту равняется 0
  • is_zero_maxover2limit – флаг: отношенение максимальной просроченной задолженности к кредитному лимиту равняется 0
  • enc_paym_{0..n} – статусы ежемесячных платежей за последние n месяцев
  • enc_loans_account_holder_type – тип отношения к кредиту
  • enc_loans_credit_status – статус кредита
  • enc_loans_account_cur – валюта кредита
  • enc_loans_credit_type – тип кредита
  • pclose_flag – флаг: плановое количество дней с даты открытия кредита до даты закрытия не определено
  • fclose_flag – флаг: фактическое количество дней с даты открытия кредита до даты закрытия не определено

3. description.xlsx – описание полей в {train/test}_target.csv и {train/test}_datа

4. sample_submission.csv - пример сабмита

  • id - идентификатор заявки на кредит
  • score - предсказание модели