Конкурс «Alice» - идентификация пользователя в Интернете по последовательности переходов по сайтам.
В этом конкурсе нужно определить конкретного пользователя сети Интернет по сессии посещения веб-сайтов. В каждой сессии может быть от 1 до 10 сайтов – количество сайтов ограничено длиной сессии. Почему конкурс называется «Alice»?
Во-первых, так назвали конкурс его создатели. Да, конкурс уже достаточно давно используется в курсе mlcourse.ai его создателем Юрой Кашницким @Yorko. Он любезно предоставил данные для перезапуска конкурса на платформе ODS, чтобы курсы, такие как «Линейные модели» и «Открытый курс машинного обучения», могли переиспользовать конкурс.
Во-вторых, Alice – это «обычное имя», например, в криптографии говорят Alice вместо «Пользователь А» и Bob вместо «Пользователь Б». Все равно как мы назовем пользователя, которого мы ищем, или «target = 1», поэтому давайте именно его, вернее, её назовём Alice. Будем искать Alice!
Данные для конкурса собраны с прокси-серверов Университета Блеза Паскаля и взяты из статьи, которая описывает методы поиска Alice. Если хочется посмотреть на все научные подходы к решению, есть книга. Современные материалы ищите в сети по словам "Traversal Pattern Mining" и "Sequential Pattern Mining".
А мы будем решать задачу методами машинного обучения как задачу классификации.
Постановка задачи
Для каждой сессии нужно предсказать, принадлежит ли сессия Alice (метка «1»), или нет (метка «0»).
Сколько решений можно отправить в день?
В день можно отправить 3 решения.
Метрика оценки решений
Целевая метрика – ROC AUC. Пример ее описания тут.
Проверка решений
На лидерборде рейтинг участников будет рассчитываться по подвыборке ответов из тестовых данных.
Конкурс заканчивается 05.06.2022 23:59:59 МСК. В это время закроется возможность отправки решений.
Окончательная оценка решений пройдет по оставшейся части ответов из тестовых данных. Таким образом, ваш рейтинг может поменяться, если вы переобучились.
Призы
Первые три места:
1) Мерч ODS
2) Контакты будут сообщены компаниям-партнерам ODS для принятия решения о собеседовании
Кодекс поведения
Просьба не выкладывать хорошие решения (ноутбуки), чтобы оставить интригу соревнования, в т.ч. в канале обсуждения конкурса.
Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy