Задача "Поиск дублей" в двухзадачном соревновании Avito ML cup 2025.
В Авито миллионы пользователей ежемесячно размещают десятки миллионов объявлений. Некоторые продавцы, желая ускорить продажу своих товаров, стараются публиковать как можно больше похожих объявлений. Однако это усложняет поиск товаров для пользователей и затрудняет работу других продавцов.
Поиск дублей — нетривиальная задача, которая требует одновременного анализа текстовых описаний и изображений. Продавцы могут описывать один и тот же товар разными словами, а фотографии могут различаться по ракурсу, фону или качеству. Например, допустимо, когда продавец размещает отдельные объявления для разных размеров одной модели кроссовок с практически идентичными описаниями и фотографиями. Однако повторная публикация одного и того же товара, даже с измененным текстом или другими фотографиями, считается дублем.
Задача — разработать алгоритм, который на основе текстовой информации, изображений и других атрибутов позволит выявлять дубли в массиве объявлений.
Ознакомиться с Правилами участия в соревновании AvitoTech ML cup 2025.
Участники могут объединяться в команды до 4 человек.
Канал общения и обсуждения между участниками всех вопросов — https://t.me/+qCniQZm_27BjNWYy
Период выбора итоговых решений до 12:00 (по московскому времени) 28 мая 2025.
Все файлы и их описание вы найдете во вкладке “Данные”
1 место - 250 000 рублей
2 место - 200 000 рублей
3 место - 150 000 рублей
Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy