OptimalDL | Data Fest 2024

Секция про то, как оптимизировать нейронки для выкатывания в прод, и экономии на инференсе

Data Fest 2024optimaldl

На секции присутствуют как обзоры современных статей по оптимизации нейронных сетей методами прунинга и квантования, так и рассказы о практическом опыте от оптимизации конкретной нейронной сети для конкретной бизнес задачи, до написания собственных CUDA кернелов для ускорения LLM. Есть даже доклад про опыт участия в соревновании по ускорению нейронки под конкретную железку! (да, такие проводятся))

Track program

Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy