NLP | Data Fest 2024

Самая масштабная секция Data Fest 2024 о том, как компьютер понимает, обрабатывает и порождает тексты на языках, на которых общаются люди.

Data Fest 2024NLP

Из докладов Вы узнаете, как подготовить данные для языковых моделей, RAG-системы: что, как и зачем, как NLP применяется в работе колл-центров, для составления музыкальных плейлистов, матчинга товаров, в проведении code review, для извлечения навыков из вакансий, а также для других интересных (и даже неожиданных) целей!

Track program

Related Tracks

Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy

Learn More

NLP | Data Fest 2024

Track program

Использование датасетов корпусной лингвистики для претрейна LM

Языковая способность больших языковых моделей

Детектор галлюцинаций в системах RAG

ESQA: Event Sequences analysis through Question Answering

SAGE: мультиязычная правка орфографии и пунктуации

RUNorm: opensource нормализатор русского текста для синтеза речи

MERA: Что под капотом кодовой базы нового бенчмарка

Применение nlp моделей для автоматизации работы колл-центра

Средства массовой информации как источник данных для ML-анализа

Как мы завели RAG в продакшене

Применение NLP для оценки уровня удовлетворенности клиентов и оптимизации смс-трафика

Classic is all you need! Подбор шаблонов для обращений клиентов

Распознавание шаблонных документов на примере паспорта РФ

Потоковая кластеризация инцидентов для быстрой обработки операторами

Digital Team Lead: автоматизация процесса code review. Узнайте, как команда BigData Beeline Казахстан попробовала GPT в CI/CD для улучшения Code Review

Экосистема open source LLM - выбор и применение

Маленькая, но удаленькая! Зачем использовать LLM размером меньше 1B параметров?

Как ковалась MERA: кодовая база под капотом бенчмарка

От чека к каталогу: извлечение свойств из названий товаров

От платоновских "Диалогов" к "сильному ИИ", или пара слов о мультимодальном RAG для LLM

Система распознавания требуемых навыков в вакансиях. "Профайлинг навыков".

Shazam для ФИО: как найти match, если имя можно написать 20 разными способами

Практика с LLM без Кристофари

Разработка мультимодального датасета для задачи суммаризации научных статей на русском языке

LLM, NER и регулярки для парсинга резюме

Как сделать мультиязычный матчинг товаров без данных

Обзор и адаптация средств оценки RAG-систем под русский язык

Разметка данных: эксперты, краудсорсинг и большие языковые модели

Составление плейлиста, который тебе понравится

Related Tracks

NLP

NLP (Data Fest 2023)

NLP

NLP (Data Fest Online 3.0)

Generative NLP

NLP in Industry