Инженер

Moscow, Saint Petersburg
RUB 200,000449,999/month
Office
Full-time

#AIAcceleration #DeepLearning #MachineLearning #LargeLanguageModels #LLM #NPU #C++ #PyTorch #TensorFlow #CUDA

Brief description of the vacancy

Мы разрабатываем современную AI-платформу для сетевых решений следующего поколения. Основной фокус - создание и тонкая настройка алгоритмов, обеспечивающих эффективную работу крупных моделей в распределённой вычислительной среде. Проект стартует «с чистого листа»: без легаси-кода и ограничений, с упором на исследования, эксперименты и внедрение нестандартных технических решений.

Ключевые области проекта:

Повышение производительности моделей машинного обучения и deep learning

Глубокая оптимизация больших языковых моделей под NPU на системном уровне

About the company

Company Speech and Data Communication lab

Мы — международная высокотехнологичная компания с инженерными подразделениями в России, входящая в число глобальных лидеров в области мобильных платформ и инновационных технологий. Мы работаем на стыке софта и железа, развивая решения в сфере оптимизации вычислений, энергоэффективности и интеллектуальной обработки данных. Наша команда объединяет специалистов из разных стран, а корпоративная культура строится вокруг инженерного качества, инноваций и сотрудничества.

Responsibilities

Анализировать актуальные научные публикации и воплощать идеи в виде рабочих прототипов

Повышать скорость обучения и инференса крупных моделей в гетерогенных вычислительных кластерах

Совместно с ML-инженерами разрабатывать масштабируемую архитектуру решений

Заниматься сжатием моделей, их упрощением и ускорением

Оптимизировать языковые и диффузионные модели для облачных сценариев, включая продвинутые техники инференса

Улучшать эффективность этапов предобработки данных и вычислительных операторов на GPU и NPU с использованием параллелизма

Выполнять низкоуровневую оптимизацию LLM под NPU через C/C++ интерфейсы

Резюме направлять в tg @khalvora

Requirements

Глубокое понимание алгоритмов ИИ и практический опыт минимум в одном направлении: компьютерное зрение, NLP, ASR или TTS

Практика работы с PyTorch и/или TensorFlow

Опыт применения методов компрессии моделей и оптимизации вычислительных операторов

Уверенное владение C++, навыки написания Bash-скриптов, понимание многопоточности и MPI

Опыт повышения производительности и работы с распределёнными вычислительными системами

Высшее техническое образование (бакалавриат, магистратура, инженерное или PhD)

Знание параллельных алгоритмов и основ вычислительной сложности

Резюме направлять в Telegram: @khalvora

Working conditions

Конкурентный уровень вознаграждения для сильных инженеров

Работу в международной профессиональной среде

Добровольное медицинское страхование

Комфортный офис с бесплатными перекусами

Возможность международных командировок, включая поездки в Китай

Бесплатный паркинг (Офис на Петроградской)

Большой спортзал прямо в офисе

Статус аккредитованной IT-компании

Гибкий график и свободное начало рабочего дня

Резюме направлять в Telegram: @khalvora

Contacts

Log InOnly registered users can open employer contacts.

Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy