Ended 23 months ago

Q: Как поучаствовать в соревновании Data Fusion Contest 2022?
A: Для участия необходимо пройти регистрацию на платформе соревнования. Затем вам необходимо разработать свое решение, и загрузить его в платформу соревнования в соответствии с правилами. Решения можно улучшать и загружать на протяжении всего соревнования.

Q: Когда заканчивается регистрация на соревнование?
A: Зарегистрироваться на соревнование можно в любое время до 15 мая 2022 23:59:59 МСК. 

Q: Можно присоединиться к соревнованию позже?
A: Можно. Загрузка решений будет доступна до 15 мая 2022 23:59:59 МСК. Решение считается принятым, когда файл загрузился на сервер полностью. Решения, загрузка которых на сервер не будет завершена до 23:59, не будут приняты.

Q: Можно ли решать сразу несколько задач?
A: Можно. Принимать участие разрешено как в какой-то одной задаче или активности, так и в любой их возможной комбинации. 

Q: Можно ли участвовать в командах?
A: Участие во всех задачах возможно в командах от 1 до 4 человек.

Q: Есть ли какие ограничения для участников из других стран?
A: Победители соревнования смогут получить денежные призы только на расчетные счета банков, зарегистрированных на территории Российской Федерации. Мы внесли изменения в Правила соревнования Data Fusion 2022 и просим вас позаботиться об открытии счета в РФ заранее.

Q: Когда будут определены победители соревнования?
A: Победители соревнования будут определены в период с 16 по 17 мая 2022. 

Q: Будет ли церемония награждения победителей?
A: Да, будет. Церемония награждения пройдет в рамках конференции Data Shelter 21 мая 2022 . Во время церемонии будут объявлены победители соревнования и вручены призы. На церемонию награждения финалисты будут приглашены лично.

Q: Как будут оцениваться решения соревнования?
A: Решения задач соревнования (1-3) оцениваются автоматически, на основе сопоставления с истинными тестовыми метками, которые доступны только организаторам. Заявки в специальные номинации оцениваются жюри из представителей организатора соревнования, а также приглашенных экспертов и исследователей после окончания приёма решений.

Q: Как определяются победители задач соревнования?
A: В каждой из задач, которые решает участник, необходимо выбрать до 2 своих финальных решений. Эти решения будут запущены и оценены на закрытых приватных тестовых данных. Именно результат на приватных данных считается официальным финальным результатом соревнования. Победителями в каждой из задач становятся участники или их команды, получившие лучшие результаты в рейтинг финальных результатов.

Q: Как выбираются финальные решения?
A: В каждой задаче можно выбрать до 2 своих финальных решений. На протяжении всего соревнования можно выбирать финальные решения, в том числе менять свой выбор. Дедлайн для выбора финальных решений - 12:00 16.05.2022. Если финальные решения не были выбраны, в их качестве  автоматически выбираются 2 лучших решения на публичной части тестовых данных. Результаты на публичных тестовых данных доступны в течение хода соревнования, но не используются при определении победителей соревнования.

Q: Можете сказать, откуда собираются данные в clickstream.csv?

A: В файле clickstream.csv трафик интернет-провайдера со всех сайтов, категоризованный по тематикам (интересам). Например, просмотр видео на Ютубе про мебель категоризуется в тематику "мебель". Аналогично с остальными сайтами: категоризуется не сам домен, а тематика конкретной страницы.

Q: В задаче Puzzle можно использовать модель или данные с главной задачи? А наоборот?

A: Да, вы можете использовать и модели и данные из разных задач на свое усмотрение.

Q: Я отправил сабмишн, получил статус “Failed”, но нет ссылки на текст ошибки. Что делать?

A: Скорее всего, в ваших предсказаниях представлены не все id, которые встречаются в списке id из файла transactions.csv в тесте. Это могло произойти, например, из-за фильтрации данных.

Q: Можно ли учитывать ограничение решение по времени (60 минут) только в части применения модели и не учитывать трансформацию данных?

A: Нет. Условия задачи подразумевают получить матч за 60 минут для входных потоков транзакций и кликстрима.

Q: Есть ли возможность посмотреть transactions.csv и clickstream.csv представленных в тесте? Эти ID присутствуют в данных для обучения?

A: Нет, эти данные недоступны участникам.

Q: Сколько данных в тесте?

A: В public и private содержится приблизительно по 3000 уникальных id. При этом public и private считаются раздельно, и следовательно ограничение по ресурсам и времени распространяется на раздельный подсчет public и private.

Cookies help us deliver our services. By using our services, you agree to our use of cookies.