Senior DevOps / Infrastructure Engineer high-load DSP (удаленная работа)

22 мая 2026

Уровень зарплаты:
з.п. не указана
Требуемый опыт работы:
Не указан

Вакансия: Senior DevOps / Infrastructure Engineer high-load DSP

Описание вакансии

О нас:

Peaklink новая мобильная DSP (Demand Side Platform), которая занимается развитием инновационного продукта. Наша цель создать платформу, которая станет лидером на рынке мобильной рекламы и поможет рекламодателям и издателям достичь новых высот.

Почему мы?

  • Возможность поучаствовать в создании нового продукта с нуля и внести свой вклад в его успех.

  • У нас работают профессионалы своего дела, которые всегда готовы поделиться опытом и знаниями.

  • Мы ценим инициативность, креативность и желание развиваться.

  • Мы предоставляем все необходимые ресурсы для работы и профессионального роста.

О роли:

Вы берёте полную ответственность за production-инфраструктуру мобильной DSP (real-time bidding): обеспечиваете её стабильность и полную утилизацию имеющегося оборудования, а затем ведёте масштабирование до 100 000+ RPS. На этой роли нужно создавать прагматичные инженерные решения и балансировать между надёжность / стоимость . Мы ищем самостоятельного Senior-инженера, который сам ставит и закрывает задачи и понимает систему достаточно глубоко.

Чем предстоит заниматься?

  1. Стабилизация и полная утилизация production. Владение observability (Prometheus / Alertmanager / Grafana / Telegraf / Vector и exporters), проектирование осмысленных метрик и алертов, непрерывный поиск bottleneck и доведение их до устранения инфраструктурные устраняете сами, по коду ставите точную задачу разработчикам; capacity planning.

  2. Масштабирование RPS на DSP. Рост throughput на текущем bare-metal, ведение архитектурного решения о дальнейшем масштабировании (гибрид k8s + bare-metal).

  3. Эксплуатация и деплой. Развёртывание и конфигурация C++-сервисов в нескольких инстансах, zero-downtime релизы через Ansible playbooks и GitLab CI; бесшовное обновление конфигураций.

  4. Базы данных и брокеры. Эксплуатация и поддержка стабильной работы ClickHouse, MySQL, Kafka, Aerospike.

  5. Внутренняя инфраструктура . Self-managed GitLab, Docker registry, runners; полноценный staging всей системы; движение к zero-trust и единому управлению доступом; резервное копирование и восстановление.

  6. Безопасность. Сетевая сегментация, управление доступом и секретами, TLS.

Что мы от тебя ждем?

  • Глубокое понимание DevOps / CI/CD и уверенная работа с Linux на уровне performance и networking (тюнинг под высокий RPS), а не только администрирования;

  • Observability на уровне владения: Prometheus / Alertmanager / Grafana / Telegraf / Vector и exporters проектирование метрик и алертов;

  • Performance engineering : поиск bottleneck в high-load сервисах (CPU / IO / network / lock contention), способность отличить инфраструктурную проблему от проблемы в коде;

  • Capacity planning и масштабирование высоконагруженных систем;

  • Ansible (основной IaC-инструмент) и GitLab CI ; Docker / Docker Compose в production;

  • Nginx как high-load entrypoint: балансировка, rate-limiting, traffic-shaping, TLS / certbot, graceful reload;

  • Операционный опыт работы с базами данных и брокерами : ClickHouse (MergeTree, partitioning / TTL, multi-disk storage policies, Kafka-engine и materialized views, ZooKeeper, диагностика медленных запросов), MySQL, Kafka, Aerospike;

  • Системное мышление об экономике надёжности : обоснованный выбор, какие компоненты должны быть отказоустойчивыми, а где допустим короткий downtime ради экономии.

Будет преимуществом:

  • Опыт в AdTech / RTB огромное преимущество (но также релевантен другой latency-sensitive high-load домен с высоким QPS поверх TCP, например fintech или биржевые системы);

  • Владение AI-инструментами разработки (Cursor, Claude Code и аналоги) большое преимущество;

  • Kubernetes / Nomad в production и готовность обоснованно вести решение о выборе между горизонтальным масштабированием на bare-metal и миграцией в Kubernetes для гибридной системы;

  • Понимание процесса C++ build / release (сборка Docker-образов, версионирование) для совместной работы с разработчиками;

  • Zero-trust / SSO (Keycloak), netbird; построение корпоративной сети;

  • Airflow / ML-инфраструктура.

Чем эта роль не является

  • Не позиция on-call / поддержки по заявкам мы ждём автономности и инициативы;

  • Не разработка инфраструктуры с нуля в облаке это гибридная bare-metal инфраструктура с приоритетом экономической эффективности;

  • Не отказоустойчивость любой ценой выбор уровня надёжности, оправданного экономически.

Soft Skills

  • Умение брать ответственность на себя и самостоятельно принимать решения;

  • Гибкий подход к решению задач и способность быстро обучаться новым инструментам;

  • Навыки планирования и приоритизации, умение эффективно распределять ресурсы;

  • Коммуникабельность: способность взаимодействовать с разработчиками, менеджерами и другими участниками команды.

Что мы предлагаем:

  • Конкурентный уровень дохода;
  • Гибкая система оплаты, включая зарплату в USD;
  • Минимум бюрократии, максимум автономии и реального влияния на продукт;
  • Возможность расти: участвовать в архитектурных решениях, выбирать инструменты, предлагать улучшения;
  • Работу с современными технологиями в быстроразвивающейся AdTech индустрии;

  • Удаленный формат работы из любой точки мира (при желании - офис в г. Москва).