Ended 3 years ago

Q: Как поучаствовать в соревновании Data Fusion Contest 2022?
A: Для участия необходимо пройти регистрацию на платформе соревнования. Затем вам необходимо разработать свое решение, и загрузить его в платформу соревнования в соответствии с правилами. Решения можно улучшать и загружать на протяжении всего соревнования.

Q: Когда заканчивается регистрация на соревнование?
A: Зарегистрироваться на соревнование можно в любое время до 15 мая 2022 23:59:59 МСК. 

Q: Можно присоединиться к соревнованию позже?
A: Можно. Загрузка решений будет доступна до 15 мая 2022 23:59:59 МСК. Решение считается принятым, когда файл загрузился на сервер полностью. Решения, загрузка которых на сервер не будет завершена до 23:59, не будут приняты.

Q: Можно ли решать сразу несколько задач?
A: Можно. Принимать участие разрешено как в какой-то одной задаче или активности, так и в любой их возможной комбинации. 

Q: Можно ли участвовать в командах?
A: Участие во всех задачах возможно в командах от 1 до 4 человек.

Q: Есть ли какие ограничения для участников из других стран?
A: Победители соревнования смогут получить денежные призы только на расчетные счета банков, зарегистрированных на территории Российской Федерации. Мы внесли изменения в Правила соревнования Data Fusion 2022 и просим вас позаботиться об открытии счета в РФ заранее.

Q: Когда будут определены победители соревнования?
A: Победители соревнования будут определены в период с 16 по 17 мая 2022. 

Q: Будет ли церемония награждения победителей?
A: Да, будет. Церемония награждения пройдет в рамках конференции Data Shelter 21 мая 2022 . Во время церемонии будут объявлены победители соревнования и вручены призы. На церемонию награждения финалисты будут приглашены лично.

Q: Как будут оцениваться решения соревнования?
A: Решения задач соревнования (1-3) оцениваются автоматически, на основе сопоставления с истинными тестовыми метками, которые доступны только организаторам. Заявки в специальные номинации оцениваются жюри из представителей организатора соревнования, а также приглашенных экспертов и исследователей после окончания приёма решений.

Q: Как определяются победители задач соревнования?
A: В каждой из задач, которые решает участник, необходимо выбрать до 2 своих финальных решений. Эти решения будут запущены и оценены на закрытых приватных тестовых данных. Именно результат на приватных данных считается официальным финальным результатом соревнования. Победителями в каждой из задач становятся участники или их команды, получившие лучшие результаты в рейтинг финальных результатов.

Q: Как выбираются финальные решения?
A: В каждой задаче можно выбрать до 2 своих финальных решений. На протяжении всего соревнования можно выбирать финальные решения, в том числе менять свой выбор. Дедлайн для выбора финальных решений - 12:00 16.05.2022. Если финальные решения не были выбраны, в их качестве  автоматически выбираются 2 лучших решения на публичной части тестовых данных. Результаты на публичных тестовых данных доступны в течение хода соревнования, но не используются при определении победителей соревнования.

Q: Можете сказать, откуда собираются данные в clickstream.csv?

A: В файле clickstream.csv трафик интернет-провайдера со всех сайтов, категоризованный по тематикам (интересам). Например, просмотр видео на Ютубе про мебель категоризуется в тематику "мебель". Аналогично с остальными сайтами: категоризуется не сам домен, а тематика конкретной страницы.

Q: В задаче Puzzle можно использовать модель или данные с главной задачи? А наоборот?

A: Да, вы можете использовать и модели и данные из разных задач на свое усмотрение.

Q: Я отправил сабмишн, получил статус “Failed”, но нет ссылки на текст ошибки. Что делать?

A: Скорее всего, в ваших предсказаниях представлены не все id, которые встречаются в списке id из файла transactions.csv в тесте. Это могло произойти, например, из-за фильтрации данных.

Q: Можно ли учитывать ограничение решение по времени (60 минут) только в части применения модели и не учитывать трансформацию данных?

A: Нет. Условия задачи подразумевают получить матч за 60 минут для входных потоков транзакций и кликстрима.

Q: Есть ли возможность посмотреть transactions.csv и clickstream.csv представленных в тесте? Эти ID присутствуют в данных для обучения?

A: Нет, эти данные недоступны участникам.

Q: Сколько данных в тесте?

A: В public и private содержится приблизительно по 3000 уникальных id. При этом public и private считаются раздельно, и следовательно ограничение по ресурсам и времени распространяется на раздельный подсчет public и private.

Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy