11 ноября 2024
Мы Yangi Bank цифровой банк в Узбекистане. Быстрый и надёжный. Хотим сделать лучший финансовый сервис для людей и бизнеса.
В нашей команде разработчики с опыт ом в финтехе, высоконагруженных системах и кибербезопасности. С нами комфортно работать и от личн о отдыхать!
Мы растём, поэтому ищем Senior SRE (Site Reliability Engineer) . Удалёнка по всему миру или офис если хотите.
Что по задачам :
Развитие систем мониторинга и алертинга :
Создание дашбордов мониторинга работы сервисов и бизнес-процессов.
Настройка алертов из разных источников, проработка планов эскалации.
Консультация и помощь смежным командам по вопросам мониторинга.
Incident & problem management :
Дежурства в форма те OnCall, реагирование на алерты, классификация и заведение инцидентов.
Устранение сбоев в работе приложений и инфраструктуры, как самостоятельно, так и с привлечением коллег из смежных команд.
Проведение Postmortem митингов и написание Postmortem. Расследование причин инцидентов, проработка мероприятий по повышению доступности сервисов, контроль выполнения этих мероприятий.
Обработка клиентских обращений :
Решение сложных кейсов и единичных сбоев в работе приложений, которые не смогли решить на 1 и 2 линии поддержки.
Автоматизация решения таких сбоев.
Проработка требований и постановка задач на разработку инструментов, которые позволят саппорту самостоятельно решать больше клиентских обращений без привлечения IT.
Какие опыт и знания мы ищем :
Опыт работы в роли SRE от 3-х лет .
Понимание принципов SRE, практический опыт внедрения практик SRE.
Опыт работы с системами мониторинга, алертинга, трассировки и логирования.
Владение языком программирования для разработки скриптов автоматизации (Python, Golang и т.д.), умение разбираться в чужом коде.
Навык troubleshooting в сложных распределенных системах.
Понимание принципов и практический опыт построения отказоустойчивых систем.
Опыт администрирования операционных систем Linux.
Плюсы работать у нас :
Возможность поучаствовать в формировании SRE направления в компании, выстроить процессы так, как они должны работать, а не так как сложилось исторически.
Свобода в выборе инструментов для реализации поставленных задач.
Как мы работаем:
Наш технологический стек :
Мониторинг, алертинг, трассировка, логи : Grafana; Sentry; Elasticsearch; VictoriaMetrics; Zabbix.
Инфраструктура : K8S; Docker; Rancher; Kafka; Nginx; Ansible.
Код : Ruby on Rails 7; Github; ArgoCD.