OptimalDL | Data Fest 2024

Секция про то, как оптимизировать нейронки для выкатывания в прод, и экономии на инференсе

Data Fest 2024optimaldl

На секции присутствуют как обзоры современных статей по оптимизации нейронных сетей методами прунинга и квантования, так и рассказы о практическом опыте от оптимизации конкретной нейронной сети для конкретной бизнес задачи, до написания собственных CUDA кернелов для ускорения LLM. Есть даже доклад про опыт участия в соревновании по ускорению нейронки под конкретную железку! (да, такие проводятся))

Track program

Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy

Learn More

OptimalDL | Data Fest 2024

Track program

Methods for optimizing Al algorithms

Ускорение Segformer для задачи сегментации в железнодорожном домене

Быстрый и экономичный инференс LLM в прикладных задачах

О том, как мы принимали участие в конкурсе LPCV2023 и получили самое точное среди быстрых решений.

Custom CUDA Kernels: Practical Approaches to Low-Level Optimizations

Model compression -Introduction intro Quantization