Для решения задачи “Labelcraft” предлагается несколько групп данных и материалов:
Заранее известный перечень категорий и подкатегорий, которые могут встретится в данных:
cat_id
– идентификатор категории (например 10229)parent_id
— идентификатор родительской категории (например 1142; пропуск если это корневая категория)cat_name
– краткое название категории (например “Аккумуляторы для фото/видеотехники”).Основная информация о товарах, включая их размеченную категорию:
hash_id
– Идентификатор товараsource_name
— Название товараattributes
– Атрибуты товара (строка с json)cat_id
– Целевая категория товара7.6MB, дополнительная разметка, полученная благодаря специальной механике
Аналогичный файл с данными о товарах, в котором отсутствует разметка
hash_id
– Идентификатор товараsource_name
— Название товараattributes
– Атрибуты товара (строка с json)Именно в таком формате решения будут получать информацию во время тестирования платформой соревнования.
Пример корректного решения с корректным образом, а также ноутбук для воспроизведения решения.
Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy