Senior Site Reliability Engineer (SRE) (удаленная работа)

17 октября 2024

Уровень зарплаты:
з.п. не указана
Требуемый опыт работы:
Не указан

Вакансия: Senior Site Reliability Engineer (SRE)

Описание вакансии

Мы Yangi Bank цифровой банк в Узбекистане. Быстрый и надёжный. Хотим сделать лучший финансовый сервис для людей и бизнеса.

В нашей команде разработчики с опыт ом в финтехе, высоконагруженных системах и кибербезопасности. С нами комфортно работать и от личн о отдыхать!

Мы растём, поэтому ищем Senior SRE (Site Reliability Engineer) . Удалёнка по всему миру или офис если хотите.

Что по задачам :

  • Развитие систем мониторинга и алертинга :

    • Создание дашбордов мониторинга работы сервисов и бизнес-процессов.

    • Настройка алертов из разных источников, проработка планов эскалации.

    • Консультация и помощь смежным командам по вопросам мониторинга.

  • Incident & problem management :

    • Дежурства в форма те OnCall, реагирование на алерты, классификация и заведение инцидентов.

    • Устранение сбоев в работе приложений и инфраструктуры, как самостоятельно, так и с привлечением коллег из смежных команд.

    • Проведение Postmortem митингов и написание Postmortem. Расследование причин инцидентов, проработка мероприятий по повышению доступности сервисов, контроль выполнения этих мероприятий.

  • Обработка клиентских обращений :

    • Решение сложных кейсов и единичных сбоев в работе приложений, которые не смогли решить на 1 и 2 линии поддержки.

    • Автоматизация решения таких сбоев.

    • Проработка требований и постановка задач на разработку инструментов, которые позволят саппорту самостоятельно решать больше клиентских обращений без привлечения IT.

Какие опыт и знания мы ищем :

  • Опыт работы в роли SRE от 3-х лет .

  • Понимание принципов SRE, практический опыт внедрения практик SRE.

  • Опыт работы с системами мониторинга, алертинга, трассировки и логирования.

  • Владение языком программирования для разработки скриптов автоматизации (Python, Golang и т.д.), умение разбираться в чужом коде.

  • Навык troubleshooting в сложных распределенных системах.

  • Понимание принципов и практический опыт построения отказоустойчивых систем.

  • Опыт администрирования операционных систем Linux.

Плюсы работать у нас :

  • Возможность поучаствовать в формировании SRE направления в компании, выстроить процессы так, как они должны работать, а не так как сложилось исторически.

  • Свобода в выборе инструментов для реализации поставленных задач.

Как мы работаем:

  • Дома или в офисе главное, чтобы было удобно. Есть 2 офиса: в Санкт-Петербурге и Ташкенте. А ещё у нас есть аккредитация.
  • Без микроменеджмента. Мы не трекаем рабочее время просто пишем в чате, если будем не на связи и спокойно идём пить кофе.
  • Отсутствие бюрократии.
  • С хорошими людьми. Пятничная пицца, квизы и Counter-Strike.
  • Официально и с заботой. Обсуждаем процессы, пробуем и внедряем новое. Любим учиться: курсы, конференции.

Наш технологический стек :

  • Мониторинг, алертинг, трассировка, логи : Grafana; Sentry; Elasticsearch; VictoriaMetrics; Zabbix.

  • Инфраструктура : K8S; Docker; Rancher; Kafka; Nginx; Ansible.

  • Код : Ruby on Rails 7; Github; ArgoCD.



Посмотрите похожие вакансии

SRE-инженер в IT-Хаб
Компания: Журавлев Александр Сергеевич
Зарплата: з.п. не указана