Конкурс «Alice» - идентификация пользователя в Интернете по последовательности переходов по сайтам.
В этом конкурсе нужно определить конкретного пользователя сети Интернет по сессии посещения веб-сайтов. В каждой сессии может быть от 1 до 10 сайтов – количество сайтов ограничено длиной сессии. Почему конкурс называется «Alice»?
Во-первых, так назвали конкурс его создатели. Да, конкурс уже достаточно давно используется в курсе mlcourse.ai его создателем Юрой Кашницким @Yorko. Он любезно предоставил данные для перезапуска конкурса на платформе ODS, чтобы курсы, такие как «Линейные модели» и «Открытый курс машинного обучения», могли переиспользовать конкурс.
Во-вторых, Alice – это «обычное имя», например, в криптографии говорят Alice вместо «Пользователь А» и Bob вместо «Пользователь Б». Все равно как мы назовем пользователя, которого мы ищем, или «target = 1», поэтому давайте именно его, вернее, её назовём Alice. Будем искать Alice!
Данные для конкурса собраны с прокси-серверов Университета Блеза Паскаля и взяты из статьи, которая описывает методы поиска Alice. Если хочется посмотреть на все научные подходы к решению, есть книга. Современные материалы ищите в сети по словам "Traversal Pattern Mining" и "Sequential Pattern Mining".
А мы будем решать задачу методами машинного обучения как задачу классификации.
Постановка задачи
Для каждой сессии нужно предсказать, принадлежит ли сессия Alice (метка «1»), или нет (метка «0»).
Сколько решений можно отправить в день?
В день можно отправить 3 решения.
Метрика оценки решений
Целевая метрика – ROC AUC. Пример ее описания тут.
Проверка решений
На лидерборде рейтинг участников будет рассчитываться по подвыборке ответов из тестовых данных.
Конкурс заканчивается 05.06.2022 23:59:59 МСК. В это время закроется возможность отправки решений.
Окончательная оценка решений пройдет по оставшейся части ответов из тестовых данных. Таким образом, ваш рейтинг может поменяться, если вы переобучились.
Призы
Первые три места:
1) Мерч ODS
2) Контакты будут сообщены компаниям-партнерам ODS для принятия решения о собеседовании
Кодекс поведения
Просьба не выкладывать хорошие решения (ноутбуки), чтобы оставить интригу соревнования, в т.ч. в канале обсуждения конкурса.
Cookies help us deliver our services. By using our services, you agree to our use of cookies.