Задача "Поиск дублей" в двухзадачном соревновании Avito ML cup 2025.
В Авито миллионы пользователей ежемесячно размещают десятки миллионов объявлений. Некоторые продавцы, желая ускорить продажу своих товаров, стараются публиковать как можно больше похожих объявлений. Однако это усложняет поиск товаров для пользователей и затрудняет работу других продавцов.
Поиск дублей — нетривиальная задача, которая требует одновременного анализа текстовых описаний и изображений. Продавцы могут описывать один и тот же товар разными словами, а фотографии могут различаться по ракурсу, фону или качеству. Например, допустимо, когда продавец размещает отдельные объявления для разных размеров одной модели кроссовок с практически идентичными описаниями и фотографиями. Однако повторная публикация одного и того же товара, даже с измененным текстом или другими фотографиями, считается дублем.
Задача — разработать алгоритм, который на основе текстовой информации, изображений и других атрибутов позволит выявлять дубли в массиве объявлений.
Ознакомиться с Правилами участия в соревновании AvitoTech ML cup 2025.
Участники могут объединяться в команды до 4 человек.
Канал общения и обсуждения между участниками всех вопросов — https://t.me/+qCniQZm_27BjNWYy
Период выбора итоговых решений до 12:00 (по московскому времени) 28 мая 2025.
Все файлы и их описание вы найдете во вкладке “Данные” после старта соревнований
1 место - 250 000 рублей
2 место - 200 000 рублей
3 место - 150 000 рублей
Cookies help us deliver our services. By using our services, you agree to our use of cookies.