Senior Site Reliability Engineer в команду Baremetal (Yandex Cloud) (удаленная работа)

16 марта 2025

Уровень зарплаты:
з.п. не указана
Требуемый опыт работы:
Не указан

Вакансия: Senior Site Reliability Engineer в команду Baremetal (Yandex Cloud)

Описание вакансии

Yandex Cloud предоставляет клиентам возможность арендовать не только виртуальные сущности, но и физические серверы. Наша команда разрабатывает и поддерживает инфраструктуру, на которой работает эта технология. Ищем инженера DevOps/SRE, который готов помочь нам в развитии сервиса.

Какие задачи вас ждут:

Деплой программного обеспечения в облаке
Вам предстоит разворачивать и поддерживать программное обеспечение по выдаче серверов клиентам в облачном Kubernetes, разворачивать и поддерживать отдельные инсталляции Kubernetes на железе там, где облачные технологии уже не работают, диагностировать проблемы сервисов и сети в этих облаках, а также мониторить ПО и серверы, на которых оно работает.

Мы ждем, что вы:

  • Хорошо понимаете устройство ОС Linux и её взаимодействие с сервером
  • Понимаете, как устроено оборудование серверов
  • Разбираетесь в устройстве сетей и умеете диагностировать их проблемы
  • Умеете и любите автоматизировать процессы на Python или Golang
  • Умеете диагностировать проблемы не только по логам приложения
  • Имеете опыт эксплуатации сервисов 24 7

Будет плюсом, если вы:

  • Проектировали и разрабатывали новые сервисы
  • Знаете k8s, умеете не только запускать сервисы внутри, но и сам k8s
  • Имели дело с Yandex Cloud и понимаете, как в нём работают виртуальные серверы
  • Понимаете, чем отличается BIOS от BMC, а UEFI-загрузка от Legacy