Для решения задачи “Labelcraft” предлагается несколько групп данных и материалов:
Заранее известный перечень категорий и подкатегорий, которые могут встретится в данных:
cat_id
– идентификатор категории (например 10229)parent_id
— идентификатор родительской категории (например 1142; пропуск если это корневая категория)cat_name
– краткое название категории (например “Аккумуляторы для фото/видеотехники”).Основная информация о товарах, включая их размеченную категорию:
hash_id
– Идентификатор товараsource_name
— Название товараattributes
– Атрибуты товара (строка с json)cat_id
– Целевая категория товараАналогичный файл с данными о товарах, в котором отсутствует разметка
hash_id
– Идентификатор товараsource_name
— Название товараattributes
– Атрибуты товара (строка с json)Именно в таком формате решения будут получать информацию во время тестирования платформой соревнования.
Пример корректного решения с корректным образом, а также ноутбук для воспроизведения решения.
Cookies help us deliver our services. By using our services, you agree to our use of cookies.