OptimalDL | Data Fest 2024

Секция про то, как оптимизировать нейронки для выкатывания в прод, и экономии на инференсе

Data Fest 2024optimaldl

На секции присутствуют как обзоры современных статей по оптимизации нейронных сетей методами прунинга и квантования, так и рассказы о практическом опыте от оптимизации конкретной нейронной сети для конкретной бизнес задачи, до написания собственных CUDA кернелов для ускорения LLM. Есть даже доклад про опыт участия в соревновании по ускорению нейронки под конкретную железку! (да, такие проводятся))

Track program

Cookies help us deliver our services. By using our services, you agree to our use of cookies.