Секция про то, как оптимизировать нейронки для выкатывания в прод, и экономии на инференсе
Data Fest 2024optimaldl
На секции присутствуют как обзоры современных статей по оптимизации нейронных сетей методами прунинга и квантования, так и рассказы о практическом опыте от оптимизации конкретной нейронной сети для конкретной бизнес задачи, до написания собственных CUDA кернелов для ускорения LLM. Есть даже доклад про опыт участия в соревновании по ускорению нейронки под конкретную железку! (да, такие проводятся))
Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy