Data Collection & Labelling | Data Fest 2025

Любой ИИ начинается с данных. Здесь вы узнаете, как готовить качественные датасеты: без шума, с пользой и без боли.

Data Fest 2025

Не секрет, что качество модели напрямую зависит от качества датасета. На этой секции эксперты из крупнейших компаний расскажут, как организовать сбор и разметку данных: от автоматизации процессов и использования нейросетей до оценки генеративных моделей и снижения затрат без потери качества. Мы обсудим реальные кейсы из банковской сферы, ИТ и телекомов, разберём метрики, мотивацию команд и технологии масштабирования. Всё, что нужно знать, чтобы превратить сырой поток информации в надежную основу для машинного обучения.

Track program

Разметка карточек товаров на LLM

Разметка карточек товаров на LLM

Юлия Силова

Как найти мнения студентов и не потонуть в спаме?

Как найти мнения студентов и не потонуть в спаме?

Полина Басина

LIBRA: как оценивать LLM на длинном контексте

LIBRA: как оценивать LLM на длинном контексте

Игорь Чурин

Пайплайн подготовки данных для проверки ремней безопасности

Пайплайн подготовки данных для проверки ремней безопасности

Алексей Сушков

Автоматизация разметки в CV: нейросети и vision-LLM против рутины

Автоматизация разметки в CV: нейросети и vision-LLM против рутины

Ярослав Волконский

YandexART: люди и нейросети в оценке генеративных моделей

YandexART: люди и нейросети в оценке генеративных моделей

Егор Бадика

Data Engineering Processing Platform

Data Engineering Processing Platform

Виктория Вольф

Сложное срочно: оптимизируем расходы на разметку без потери в качестве

Сложное срочно: оптимизируем расходы на разметку без потери в качестве

Анна Дружкина

Аналитика, данные, метрики и мотивация: как построить процесс разметки в большом банке

Аналитика, данные, метрики и мотивация: как построить процесс разметки в большом банке

Роман Кузнецов

Генерируй, адаптируй и властвуй: битва за данные в ЖД-автопилоте

Генерируй, адаптируй и властвуй: битва за данные в ЖД-автопилоте

Анатолий Медведев

Обучение разметчиков для получения качественных данных и внедрение AI-first

Обучение разметчиков для получения качественных данных и внедрение AI-first

Дмитрий Доброхотов

Оценка уверенности генеративной модели в разметке данных

Оценка уверенности генеративной модели в разметке данных

Олег Лайок

1

Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy