AI Acceleration Engineer (Инженер по ускорению ИИ)

Saint Petersburg
RUB 300,000600,000/month
Office
Full-time

#AIAcceleration #DeepLearning #MachineLearning #LargeLanguageModels #LLM #NPU #C++ #PyTorch #TensorFlow #CUDA

Brief description of the vacancy

Мы создаём вычислительную платформу искусственного интеллекта для сетевых технологий нового поколения. Наша цель — разработка и оптимизация алгоритмов для эффективной работы больших моделей в распределённых системах. У нас нет устаревшей кодовой базы — мы начинаем разработки с нуля и ищем инженеров, готовых экспериментировать и внедрять новые подходы.

По проекту два ключевых направления:

Ускорение ML/Deep Learning моделей.

Низкоуровневая оптимизация LLM под NPU __

About the company

Company CNCore Technologies (Крупная китайская компания)

Company CNCore Technologies (Крупная китайская компания)

Мы — международная высокотехнологичная китайская компания с инженерными центрами в России, входящая в группу мировых лидеров индустрии в области мобильных платформ и инновационных решений. Наши разработки сосредоточены на передовых технологиях сжатия данных, оптимизации производительности и энергоэффективности, а также интеграции программного и аппаратного обеспечения. В компании работают талантливые специалисты со всего мира, и мы ценим инновации, качество и командную работу.

Responsibilities

Отслеживать новые научные разработки и создавать прототипы на их основе.

Оптимизировать обучение и инференс крупных ИИ-моделей на гетерогенных кластерах.

Проектировать масштабируемые решения совместно с AI-разработчиками и дата-сайентистами.

Работать над компрессией, миниатюризацией и ускорением моделей.

Ускорять языковые и диффузионные модели различными методами (включая speculative inference) для облачных сервисов.

Повышать эффективность предобработки данных и операторов на GPU/NPU с использованием параллельных методов.

Реализовывать низкоуровневую оптимизацию LLM под NPU (через C/C++ API).

Резюме направлять в tg @khalvora Почта obryashchenko.anna@h-partners.com

Requirements

Отличное знание алгоритмов ИИ и экспертиза хотя бы в одной из областей: CV, NLP, ASR, TTS.

Опыт с фреймворками: PyTorch, TensorFlow.

Навыки работы с методами компрессии моделей и оптимизацией операторов.

Уверенное владение C++, опыт написания Bash-скриптов, понимание многопоточности, MPI.

Опыт оптимизации производительности, работы с распределёнными системами.

Высшее техническое образование (магистр / инженер / PhD) или 5+ лет релевантного опыта.

Знание параллельных алгоритмов и теории алгоритмической сложности. Резюме направлять в tg @khalvora

Working conditions

Конкурентную компенсацию для специалистов топ-уровня.

Работу в международной команде.

Медицинскую страховку (ДМС).

Уютный офис с фруктами, снеками и пиццей.

Возможность частых зарубежных командировок (по желанию).

Командировки в Китай.

Подземный бесплатный паркинг.

Спортзал в офисе.

Аккредитованная ИТ-компания.

Гибкий график и свободное начало дня.

Резюме направлять в tg @khalvora

Contacts

Log InOnly registered users can open employer contacts.

Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy