Ended 4 months ago
350 participants
1754 submissions

Соревнование Data Fusion Contest 2022. Задача Education

Упражнение для тех, кто хочет научиться работать с индустриальными данными транзакций и кликстримов: создайте алгоритм, способный предсказывать наличие высшего образования у клиента.

transactionsclickstreameducationdatafusion

Образовательная задача. Education

Хотите научиться работать с данными транзакций и кликстрима? Выполнив эту упрощенную задачу на общих данных соревнования, вы научитесь строить различные признаки и представления. При этом вы решите классическую задачу классификации: определите наличие у пользователя высшего образования.

Правила участия

Нажимая кнопку «Участвовать» и/или «Отправить решение», вы соглашаетесь с Правилами участия в соревновании Data Fusion Contest 2022.

Данные

Для решения образовательной задачи во вкладке данные участникам доступны несколько наборов данных: 

  1. Общие данные для всех задач в табличном .csv формате: transactions.zipclicstream.zip и целевая переменная train_matching.csv
  2. Общие сопроводительные данные для всех задач в табличном .csv формате: mcc_codes.csvclick_categories.csv и currency_rk.csv
  3. Специфичные только для образовательной задачи, дополнительный файл с целевой переменной (наличием высшего образования)  train.csv для подмножества клиентов ВТБ, а также пример сабмита решение sample_submission.csv

Ссылки на скачивание данных доступны во вкладке Данные для присоединившихся к соревнованию участников.

Проверка решений

  • Решения проверяются автоматически путем сопоставления с известными метками наличия высшего образования.
  • Метрика соревнования — ROC-AUC.
  • Соотношение public/private в соревновании составляет 50/50. Победители соревнования определяются по результатам на private лидерборде.

Информация для участников

  • В соревновании могут принимать участие граждане со всего мира. Участники могут объединяться в команды до 4 человек. Участвовать можно в любом количестве из предложенных задач и номинаций.
  • Ответы на часто задаваемые вопросы по задаче Education можно найти на странице FAQ. Ответы на вопросы по всему Data Fusion Contest 2022 доступны на FAQ странице трека.
  • Официальный канал общения и обсуждения между участниками всех задач — канал #proj_data_fusion_22 в ODS #slack. Важные анонсы, объявления, и ответы на вопросы будут сперва появляться в канале ODS, после чего добавляться в FAQ и новости соревнования на ods.ai.

Дополнительные активности

  • Участвуйте в специальных номинациях, каждая из которых имеет свой призовой фонд! Делитесь вашими решениями с другими участниками соревнования в канале #proj_data_fusion_22 в рамках номинации Companion, либо отправляйте ваши нестандартные решения в номинацию Insight.
  • Следите за новостями Data Fusion Contest 2022 — вас ждут митапы и воркшопы с разборами решений задач, а также регулярные розыгрыши мерча ODS!
  • Уникальный механизм добавления предрасчитанных фичей! Вы можете создать публичное решение с генерацией фичей, которые мы добавим отдельной папкой с фичами, доступными внутри контейнера. Голосования за добавление фичей будут проходить в канале #proj_data_fusion_22, а добавленные фичи будут анонсироваться на митапах.

Призы

Эта задача не имеет денежных призов, но его результаты учитываются в общем сводном рейтинге Data Fusion 2022. Также, топ-30 участников получат памятные толстовки ODS.