NLP | Data Fest 2024

Самая масштабная секция Data Fest 2024 о том, как компьютер понимает, обрабатывает и порождает тексты на языках, на которых общаются люди.

Data Fest 2024NLP

Из докладов Вы узнаете, как подготовить данные для языковых моделей, RAG-системы: что, как и зачем, как NLP применяется в работе колл-центров, для составления музыкальных плейлистов, матчинга товаров, в проведении code review, для извлечения навыков из вакансий, а также для других интересных (и даже неожиданных) целей!

Track program

Использование датасетов корпусной лингвистики для претрейна LM

Использование датасетов корпусной лингвистики для претрейна LM

Илья Козиев

11
Языковая способность больших языковых моделей

Языковая способность больших языковых моделей

Ксения Студеникина

1
Детектор галлюцинаций в системах RAG

Детектор галлюцинаций в системах RAG

Виктор Носко, Захар Понимаш, Марат Потанин

1
ESQA: Event Sequences analysis through Question Answering

ESQA: Event Sequences analysis through Question Answering

Ирина Абдуллаева

2
SAGE: мультиязычная правка орфографии и пунктуации

SAGE: мультиязычная правка орфографии и пунктуации

Никита Мартынов, Даниил Астафуров

21
RUNorm: opensource нормализатор русского текста для синтеза речи

RUNorm: opensource нормализатор русского текста для синтеза речи

Денис Петров

1
MERA: Что под капотом кодовой базы нового бенчмарка

MERA: Что под капотом кодовой базы нового бенчмарка

Артем Червяков, Алена Феногенова, Леонид Синев

2
Применение nlp моделей для автоматизации работы колл-центра

Применение nlp моделей для автоматизации работы колл-центра

Альберт Акопян

11
Средства массовой информации как источник данных для ML-анализа

Средства массовой информации как источник данных для ML-анализа

Владимир Ловцов

1
Как мы завели RAG в продакшене

Как мы завели RAG в продакшене

Михаил Дремин, Петр Королев

1
Применение NLP для оценки уровня удовлетворенности клиентов и оптимизации смс-трафика

Применение NLP для оценки уровня удовлетворенности клиентов и оптимизации смс-трафика

Анна Ширшова

11
Classic is all you need! Подбор шаблонов для обращений клиентов

Classic is all you need! Подбор шаблонов для обращений клиентов

Дмитрий Баканов

1
Распознавание шаблонных документов на примере паспорта РФ

Распознавание шаблонных документов на примере паспорта РФ

Руслан Забалуев

1
Потоковая кластеризация инцидентов для быстрой обработки операторами

Потоковая кластеризация инцидентов для быстрой обработки операторами

Иван Олейников

1
Digital Team Lead: автоматизация процесса code review. Узнайте, как команда BigData Beeline Казахстан попробовала GPT в CI/CD для улучшения Code Review

Digital Team Lead: автоматизация процесса code review. Узнайте, как команда BigData Beeline Казахстан попробовала GPT в CI/CD для улучшения Code Review

Елдос Адетбеков

1
Экосистема open source LLM - выбор и применение

Экосистема open source LLM - выбор и применение

Николай Калуженков

2
Маленькая, но удаленькая! Зачем использовать LLM размером меньше 1B параметров?

Маленькая, но удаленькая! Зачем использовать LLM размером меньше 1B параметров?

Иван Бондаренко

11
Как ковалась MERA: кодовая база под капотом бенчмарка

Как ковалась MERA: кодовая база под капотом бенчмарка

Мария Тихонова

1
От чека к каталогу: извлечение свойств из названий товаров

От чека к каталогу: извлечение свойств из названий товаров

Анна Маршалова

2
От платоновских "Диалогов" к "сильному ИИ", или пара слов о мультимодальном RAG для LLM

От платоновских "Диалогов" к "сильному ИИ", или пара слов о мультимодальном RAG для LLM

Роман Дерунец

221+1
Система распознавания требуемых навыков в вакансиях. "Профайлинг навыков".

Система распознавания требуемых навыков в вакансиях. "Профайлинг навыков".

Александр Ковалёв

2
Shazam для ФИО: как найти match, если имя можно написать 20 разными способами

Shazam для ФИО: как найти match, если имя можно написать 20 разными способами

Андрей Мирошников

1
Практика с LLM без Кристофари

Практика с LLM без Кристофари

Антон Легченко

1
Разработка мультимодального датасета для задачи суммаризации научных статей на русском языке

Разработка мультимодального датасета для задачи суммаризации научных статей на русском языке

Алёна Цанда

1
LLM, NER и регулярки для парсинга резюме

LLM, NER и регулярки для парсинга резюме

Валерия Елпатьевская

111
Как сделать мультиязычный матчинг товаров без данных

Как сделать мультиязычный матчинг товаров без данных

Александр Деев

11
Обзор и адаптация средств оценки RAG-систем под русский язык

Обзор и адаптация средств оценки RAG-систем под русский язык

Ольга Масаева

51
Разметка данных: эксперты, краудсорсинг и большие языковые модели

Разметка данных: эксперты, краудсорсинг и большие языковые модели

Мария Молчанова

111
Составление плейлиста, который тебе понравится

Составление плейлиста, который тебе понравится

Ринат Муллахметов, Владимир Кравцов

1

Related Tracks

Cookies help us deliver our services. By using our services, you agree to our use of cookies.