LLM Platform Engineer (ML Engineer) (удаленная работа)

24 декабря 2025

Уровень зарплаты:
з.п. не указана
Требуемый опыт работы:
Не указан

Вакансия: LLM Platform Engineer (ML Engineer)

Описание вакансии

Открыта вакансия LLM Platform Engineer (ML Engineer) на проект финтех.

Задачи:

  • Развертывание и оптимизация LLM моделей на multi-GPU установках с tensor/pipeline/data parallelism
  • Организация MLOps-процессов и системная оценка качества моделей
  • Обеспечение production latency <2s и uptime > 95% для инфраструктуры inference
  • Профилирование и оптимизация использования VRAM (CUDA OOM prevention)
  • Мониторинг GPU-производительности

Мы ожидаем от тебя:

  • Python (asyncio, multiprocessing, typing) Advanced уровня
  • Bash/Shell scripting Advanced уровня для автоматизации развертывания
  • Практический опыт с vLLM, TensorRT-LLM, TGI для serving моделей
  • Опыт работы с квантизацией (AWQ, GPTQ, GGUF) для снижения требований к VRAM
  • Знание оптимизаций Flash Attention и Paged Attention
  • Навыки работы с PyTorch, JAX, ONNX для универсального развертывания
  • Опыт отладки GPU memory и понимание CUDA (Intermediate C++/CUDA)

Будет плюсом:

  • Опыт развертывания моделей на multi-GPU
  • Практика профилирования VRAM usage в production-средах
  • Опыт работы с моделями 480B+ параметров на кластерах GPU
  • Знание специфических GPU scheduling инструментов (Volcano, Kueue)


Посмотрите похожие вакансии

Senior ML Engineer / Research Engineer (NLP)
Компания: Just AI
Зарплата: з.п. не указана
Senior Python/ML Engineer
Компания: ICVR
Зарплата: з.п. не указана
Web3 Backend Engineer (Go)
Компания: EmFi Technologies Limited
Зарплата: от 244 069 до 406 781 руб.