Senior ML Engineer

San Francisco
$5,00010,000/month
Remote
Full-time

Machine LearningPythonLLM

Brief description of the vacancy

Привет! Мы создаем AI спикинг коуча, который помогает улучшать английский на созвонах, и ищем Senior ML Engineer в нашу топовую команду (ex-Google, Nvidia, Lyft и др.). Работаем с передовыми технологиями LLM, ML для аудио, и строим кастомные сервисы на Python. Полный async remote, любые таймзоны, вилка от $5k + опционы. Нужен опыт с ML, Python, LLM. Знание docker и опыт с AWS — must have.. У нас скорость, ответственность за свои проекты и возможность влиять на продукт. Присоединяйся к нам!

About the company

Fluently. Мы делаем лучшего в мире AI спикинг коуча, который слушает ваши онлайн колы и помогает прокачивать английский. Недавно прошли Y Combinator и подняли $2.5M. Команда состоит из 5 топовых ребят (prev. Google, Nvidia, Lyft, Amazon, Snowflake), нанимаем медленно и прицельно.

Responsibilities

  • Тренировать, оценивать и сёрвить модельки в облаке или на девайсе. Может быть катбуст на CPU, может быть жирная LLM на GPU, а может быть Whisper на M1.
  • Строить сервисы c использованием LLM: [Agentic] RAG, LLM/Embeddings Fine-Tuning, Structured Outputs, Custom Llama Serving — нужно разбираться в последних трендах.
  • Реализовывать и улучшать пайплайны для обработки аудио и текста. У нас свой кастомный подход и большой опыт работы с ML для аудио (даже публикации имеются).
  • Помогать создавать полноценный эффективный API, как для пайплайнов так и для приложения в целом. Крайне желательно наличие похожего опыта в прошлом.
  • Чуть-чуть разбираться в инфре. Не highload, но на тысячах юзеров должно работать стабильно. Знание docker и опыт с AWS — must have.
  • БОльшая часть кода на Python, возможен C/C++, иногда JavaScript/Swift.
  • Мы за красивый и понятный код и разработку (но без фанатизма) — black, isort, ruff, mypy, pydantic, docker, CI/CD, тесты, логи, git, code review, docs, sentry, linear, etc.

Requirements

  • Опыт в ML от 2 лет,
  • Опыт настройки сервисов с использованием LLM, GPU, CPU
  • Уверенный python - это наш основной стек,
  • Желание работать в стартапе - то есть быстро, круто, проактивно.

Working conditions

  • Работа на больших скоростях: единственное правило — регулярно и много деливерить
  • Ежедневная работа напрямую с CEO/CTO. Вы будете employee #6.
  • Мы ожидаем самостоятельности: надо овнить свои проекты end2end
  • Вилка от $5k (зависит от ваших скиллов и размера опциона)
  • Full Async Remote, любая таймзона
    • Желающих можем подать на H1-b
    • Не нанимаем людей находящихся в РФ (по этическим или лигал соображениям)
  • За рекомендацию — последний айфончик бонусом (при условии что человек проработает 3+ месяца)

Contacts

Log InOnly registered users can open employer contacts.

Cookies help us deliver our services. By using our services, you agree to our use of cookies.