Секция про то, как оптимизировать нейронки для выкатывания в прод, и экономии на инференсе
Data Fest 2024optimaldl
На секции присутствуют как обзоры современных статей по оптимизации нейронных сетей методами прунинга и квантования, так и рассказы о практическом опыте от оптимизации конкретной нейронной сети для конкретной бизнес задачи, до написания собственных CUDA кернелов для ускорения LLM. Есть даже доклад про опыт участия в соревновании по ускорению нейронки под конкретную железку! (да, такие проводятся))
Cookies help us deliver our services. By using our services, you agree to our use of cookies.