Ended 2 months ago

26.05 — online доклады и активности Data Fest 2024

Смотрим доклады, общаемся со спикерами, участвуем в активностях и нетворкаемся ❤

Расписание online дня в spatial.chat

Data Governance трек

11:00, Наиля Галимова 
Data Quality c нуля: инструменты, ошибки, выгода для бизнеса.
12:00, Александр Бергер 
Data Quality, как часть каталога данных СИБУР. Опыт внедрения практики в большой организации.
13:00, Андрей Азеев 
Опыт создания Data Quality инструмента в компании МТС.

NLP трек

11:10, Илья Козиев 
Использование датасетов корпусной лингвистики для претрейна LM
11:35, Ксения Студеникина 
Языковая способность больших языковых моделей
12:00, Виктор Носко, Захар Понимаш, Марат Потанин 
Детектор галлюцинаций в системах RAG
12:25, Ирина Абдуллаева 
ESQA: Event Sequences analysis through Question Answering
12:50, Никита Мартынов, Даниил Астафуров 
SAGE: мультиязычная правка орфографии и пунктуации
13:15, Денис Петров 
RUNorm: opensource нормализатор русского текста для синтеза речи
13:40, Артем Червяков, Алена Феногенова, Леонид Синев 
MERA: Что под капотом кодовой базы нового бенчмарка

CV трек

12:00, Ivan Gorbunov 
Как мы боролись со спамом в отзывах
12:25, Alexander Aksenov 
Как мы считаем людей на улице с помощью YOLO
12:50, Ekaterina Derevyanka 
Open Vocabulary Segmentation: Unlocking Flexible Robotic Perception
13:15, David Svitov 
Наш метод "HAHA" и краткий экскурс в аватаростроение

OptimalDL трек

12:00, Дмитрий Иванов 
Сделает обзор области оптимизации нейронных сетей, а именно методов прунинга и квантования. Доклад охватывает направления исследований от Lottery ticket hypothesis до 4ех битного квантования LLM.
13:00, Дмитрий Раков 
Расскажет о своем опыте ускорения нейронной сети SegFormer для задачи сегментации в ЖД домене. Докладчик разработал собственный фреймворк для data aware прунинга данной архитектуры, и смог получить ускорение в 1,5 раза при незначительной потере точности. 
14:00, Алексей Гончаров 
Поделится опытом оптимизации расходов на инференс LLM с применением квантования, дообучения моделей, LoRA адаптеров и низкоуровневых фреймворков инференса.
15:00, Андрей Щербин 
Поведает о том, как мы принимали участие в конкурсе LPCV2023 и получили самое точное среди быстрых решений.
16:00, Григорий Алексеев 
Расскажет об опыте написания собственного CUDA-kernel-а для оптимизации Flash Attention.
17:00, Егор Швецов 
Затронет аспекты оптимизации инференса нейронных сетей начиная от железа, заканчивая исследованиями по оптимизации LLM.

Собеседования в никуда

12:00, Антон Воронов, Анастасия Малышева, и менторы ODS 
Активность не под запись — отличный шанс попробовать пройти виртуальное собеседование в несуществующую компанию и услышать рекомендации. У нас всегда очень уютная атмосфера, но если захочется жести, только скажите 😁

ML in Marketplace трек Avito.tech

13:00, команда Avito.tech 
Q&A сессии с рекрутментом 
14:30, команда Avito.tech 
ML System design game. Workshop
15:40, команда Avito.tech 
ML System design game. Practice
16:40, команда Avito.tech 
Q&A сессии с лидами направлений DS и аналитики Авито

Time Series трек

15:30, Мартин Габд 
Foundation модели: есть ли жизнь во временных рядах
16:00, Герман Родиков 
Predicting specific time series by blending deep learning techniques with domain-specific knowledge
16:30, Александр Греков 
Прогноз и выделение аномалий в данных активности двустворчатых моллюсков
17:00, Юрий Кацер 
Сегментация временных рядов: от классических подходов до ансамблей
17:30, Екатериан Кочурова 
Profit Prophet: гадаем на подушках или как оценить эффективность новой системы поиска

Cookies help us deliver our services. By using our services, you agree to our use of cookies.