Образовательная задача. Education
Хотите научиться работать с данными транзакций и кликстрима? Выполнив эту упрощенную задачу на общих данных соревнования, вы научитесь строить различные признаки и представления. При этом вы решите классическую задачу классификации: определите наличие у пользователя высшего образования.
Правила участия
Нажимая кнопку «Участвовать» и/или «Отправить решение», вы соглашаетесь с Правилами участия в соревновании Data Fusion Contest 2022.
Данные
Для решения образовательной задачи во вкладке данные участникам доступны несколько наборов данных:
- Общие данные для всех задач в табличном
.csv
формате: transactions.zip
, clicstream.zip
и целевая переменная train_matching.csv
- Общие сопроводительные данные для всех задач в табличном
.csv
формате: mcc_codes.csv
, click_categories.csv
и currency_rk.csv
- Специфичные только для образовательной задачи, дополнительный файл с целевой переменной (наличием высшего образования)
train.csv
для подмножества клиентов ВТБ, а также пример сабмита решение sample_submission.csv
Ссылки на скачивание данных доступны во вкладке Данные для присоединившихся к соревнованию участников.
Проверка решений
- Решения проверяются автоматически путем сопоставления с известными метками наличия высшего образования.
- Метрика соревнования —
ROC-AUC.
- Соотношение public/private в соревновании составляет 50/50. Победители соревнования определяются по результатам на private лидерборде.
Информация для участников
- В соревновании могут принимать участие граждане со всего мира. Участники могут объединяться в команды до 4 человек. Участвовать можно в любом количестве из предложенных задач и номинаций.
- Ответы на часто задаваемые вопросы по задаче Education можно найти на странице FAQ. Ответы на вопросы по всему Data Fusion Contest 2022 доступны на FAQ странице трека.
- Официальный канал общения и обсуждения между участниками всех задач — канал #proj_data_fusion_22 в ODS #slack. Важные анонсы, объявления, и ответы на вопросы будут сперва появляться в канале ODS, после чего добавляться в FAQ и новости соревнования на ods.ai.
Дополнительные активности
- Участвуйте в специальных номинациях, каждая из которых имеет свой призовой фонд! Делитесь вашими решениями с другими участниками соревнования в канале #proj_data_fusion_22 в рамках номинации Companion, либо отправляйте ваши нестандартные решения в номинацию Insight.
- Следите за новостями Data Fusion Contest 2022 — вас ждут митапы и воркшопы с разборами решений задач, а также регулярные розыгрыши мерча ODS!
- Уникальный механизм добавления предрасчитанных фичей! Вы можете создать публичное решение с генерацией фичей, которые мы добавим отдельной папкой с фичами, доступными внутри контейнера. Голосования за добавление фичей будут проходить в канале #proj_data_fusion_22, а добавленные фичи будут анонсироваться на митапах.
Призы
Эта задача не имеет денежных призов, но его результаты учитываются в общем сводном рейтинге Data Fusion 2022. Также, топ-30 участников получат памятные толстовки ODS.