22 ноября 2025
Почему у нас тебе понравится:
Большой пул проектов сможешь переходить в разные команды и не выгорать от однообразия;
Только крупные известные бренды ты приобретешь бесценный опыт разработки/управления разработкой продукта или сервис для крупного банка, завода или авиакомпании;
Прозрачные понятные процессы будешь заниматься только своей любимой разработкой, а не часами разбираться что здесь происходит ;
Внимательный и тщательный онбординг в компанию;
Компенсация на обеды в кафе и ресторанах , а также большой выбор скидок от партнеров (скоро расширим список в новых городах присутствия);
Проводим яркие мероприятия , на которых можно уйти в отрыв и отдохнуть по полной.
IBS Dunice это команда опытных разработчиков, тестировщиков, аналитиков, дизайнеров и менеджеров. Мы создаем веб-сервисы и мобильные приложения, которыми пользуются миллионы! В компании уже больше 350 человек.
Задачи:
Создать и развивать инфраструктуру для сервисов, использующих ML/AI-модели (GPU-сервера, контейнеризированные сервисы, кластер Kubernetes).
Автоматизировать процессы поставки: CI/CD-пайплайны для обучения, тестирования и деплоя сервисов.
Настраивать мониторинг сервисов и инфраструктуры (Prometheus, Grafana), включая метрики качества моделей и данных.
Интегрировать инструменты контроля качества данных и стабильности сервисов (Evidently, Deepchecks).
Оптимизировать производительность сервисов инференса: latency, throughput, масштабирование под нагрузку.
Требования:
Уверенный опыт работы DevOps/SRE/Platform-инженером.
Глубокие знания Linux, Docker, Kubernetes, сетевых основ.
Опыт построения CI/CD (Jenkins, GitLab CI, GitHub Actions и/или Ansible).
Понимание принципов работы сервисов для инференса моделей (REST/gRPC, батчинг, ресурсы GPU/CPU).
Опыт эксплуатации распределённых систем.
Навык работы с ML-пайплайнами: хранение артефактов, версияция, автоматизация, отслеживание экспериментов (MLflow, Airflow).
Опыт настройки мониторинга (Prometheus + Grafana).
Будет плюсом
Опыт развёртывания или эксплуатации платформ для ML-оркестрации: Kubeflow, MLflow, Airflow.
Опыт работы с inference-серверами (vLLM, TGI, Triton) как с приложениями, а не обязательно понимание внутренних ML-алгоритмов.
Опыт настройки data/feature-quality checks (Evidently, Deepchecks).
Понимание базовых концепций ML-моделей: обучение - валидация - деплой - мониторинг
Организационные вопросы:
После отклика с тобой свяжется наш рекрутер. Проведет предварительный скрининг, ответит на все вопросы и организует техническое интервью (если по требованиям всё ок).