Ended 10 months ago
96 participants
485 submissions

Hidden
НТО 24-25 Финальный этап

Реши задачу реидентификации амурских тигров по фото с фотоловушек с помощью компьютерного зрения.

Принимая участие в соревновании, вы соглашаетесь с правилами проведения финала профиля ИИ НТО

Описание задачи

Амурский тигр занесен в Красную книгу РФ. Мониторинг популяции помогает собрать данные о численности тигров, их распределении и состоянии среды обитания. Это является основой для разработки эффективных мер по защите и восстановлению популяции.

Фотоловушки предоставляют возможность отслеживать поведение тигров, их миграционные маршруты, предпочтения в выборе места обитания и взаимодействие с другими видами. Эти данные помогают исследовать экосистемные связи и влиять на сохранение всего вида на более широком уровне.

Ученые зоологи определяют особей тигра по индивидуальному узору на шкуре животного на фото, при этом узор с каждой стороны различен. Это ресурсозатратная и требующая экспертных знаний и знаний каталога особей конкретного вида животных на заповедной территории задача, которая каждый год стоит перед учеными зоологами.

Реидентификация и мониторинг каждой отдельной особи позволяет более эффективно отслеживать популяцию тигров.

Качество снимков с фотоловушек значительно отличается от профессиональных фото. Исследователям необходимо обрабатывать фото, полученные в разное время суток и время года, содержащие часть животного или группу животных, перекрывающих друг друга.

Задача финала посвящена реидентификации диких животных (определение конкретных особей) по фото с фотоловушек. 

Технологии искусственного интеллекта помогают быстрее и проще обрабатывать данные для реидентификации животных. Это сэкономит время зоологов, позволяя им больше сосредоточиться на спасении животных и научных исследованиях.

Финалистам необходимо решить задачу реидентификации амурских тигров по фото с фотоловушек с помощью технологии компьютерного зрения. 

Метрика

Для оценки качества работы модели реидентификации используется метрика взвешенная CMC по особям, с учтем, что пропускаются фотографий содержащие тигра из той же серии.

1 - на 1-ом месте находится правильная особь,

0.9 - на 2-ом месте находится правильная особь,

0.8 - на 3-ом месте находится правильная особь,

0.7 - на 4-ом месте находится правильная особь,

0.6 - на 5-ом месте находится правильная особь,

0 - на 6-ом месте и дальше находится правильная особь.

$$ cmc_{w} =  \frac{1}{N}\sum_{j=1}^N \sum_{i=0}^4 w[i] * sign(find(j) == i), $$

где w=[1, 0.9, 0.8, 0.7, 0.6],

sign(*) - индикаторная функция (1, если истина, иначе 0).

find(j) - номер первого вхождение особи j, исключая эту же особь из той же серии, что и фотография запроса j.  

Значение метрики варьируется от 0 (в худшем случае) до 1, если в списке предсказанных особей первая верно предсказанная особь, пропуская фотографии с той же особью и из той же серии.

Под серией понимается совокупность фото, сделанных в один промежуток времени с одинаковыми условиями сьемки.

Подсчет метрики производится автоматически на платформе при отправке решения.

Данные

Датасет представляет собой набор изображений в виде архива изображений (train, test) и файл train.csv. 

Обратите внимание, что в датасете присутствуют сложные примеры: фото, когда в кадр попала часть животного, тело животного разделено препятствием, а также ночные и смазанные снимки. Данные были размечены специалистами по разметке данных совместно с учеными зоологами.
Данные разделены на тренировочную и тестовую выборки в соотношении примерно 70% и 30% по особям.

Файл train.csv содержит следующие колонки:

  • file_name - имя файла
  • label - название особи
  • sequence - номеру серии фотографий, к которой относится данное фото
  • side - сторона особи на фото (left/right)
     

Baseline (базовое решение)

Приведенный пример решения задачи реидентификации животных на изображении основан на библиотеке open metric learning(архитектура resnet50).

Бейзлайн позволяет пройти путь от установки библиотек и обучения модели до получения файла с предсказаниями и логов обучения.

Формат решения

Соревнование подразумевает отправку файла с предсказаниями модели на платформу для расчета метрики.

Сам файл представляет собой csv документ с двумя колонками **image_name** и  **recommendation**.  Строки - это пары с названием файла изображения и соответствующего отсортированному списку всех фото из тестовой выборки(начиная от самого похожего изображения до менее похожего).

Пример формирования корректного файла с предсказаниями.

Использование сторонних датасетов

Допускается использование открытых (доступных в сети) датасетов с лицензиями MIT, Apache 2.0, позволяющей свободное некоммерческое использование, в случае возникновения вопросов возможности использования пишите, спрашивайте.

Организаторы не несут ответственность за содержание работ участников олимпиады в части возможного нарушениями ими авторских (смежных) прав. Претензии, связанные с такими нарушениями авторских (смежных) прав, направляются непосредственно лицам, представившим такие работы.

Для того чтобы мы могли воспроизвести ваше решение, необходимо предоставить все использованные открытые датасеты в том формате, в котором они были применены для обучения.

Внимание. 

Приватный обмен идеями (private sharing), решениями и кодом между участниками — запрещен. В случае обнаружения этого факта, все причастные решения аннулируются.

Ручная разметка данных запрещена.

Все участники, занявшие призовые места должны прислать воспроизводимые решения.

Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy