22 ноября 2024
Что такое eXpress
Процесс работы
Мы любим и умеем работать удалённо. Все наши внутренние процессы выстроены так, чтобы наши сотрудники свободно работали из любого комфортного места, оставались на связи и чувствовали себя частью коллектива. По желанию можно работать в офисе.
Сейчас мы формируем команду SRE и у будущего коллеги будет возможность напрямую влиять на процессы, выбор подходов и технологий.
Чем предстоит заниматься:
- Участвовать в развитии SRE практик компании;
- Сопровождать и администрировать боевые контура с приложением;
- Сопровождать релизы приложения;
- Обеспечивать и повышать надежность приложения;
- Разрабатывать системы автоматизации рутины на базе Python/Golang;
- Разрабатывать алерты и CI/CD алертов;
- Разрабатывать Postmortems и Runbooks;
- Участвовать в постоянном улучшении системы мониторинга;
- Взаимодействовать с разработчиками продукта, QA, DevOps;
- Планировать и проводить работы на тестовых и промышленных контурах;
- Участвовать в развитии архитектуры систем;
- Решать инциденты совместно с разработчиками, реагировать на алерты;
- Оказывать консультации о параметрах работы системы, локализовывать проблемы, эскалировать баги на разработчиков;
- Планировать и проводить работы на тестовых и промышленных инсталляциях;
- Повышать наблюдаемость приложений;
- Документировать активности в Confluence/Jira, описывать архитектуру взаимодействия компонентов, процедур обновления;
- Взаимодействовать с разработчиками продукта, QA, DevOps;
- Участвовать в развитии SRE практик компании;
- Проводить работы по повышению отказоустойчивости и масштабируемости сервисов.
Что для нас важно:
- Уверенные знания Linux;
- Уверенные знания DevOps практик;
- Понимание принципов работы SRE;
- Практический опыт работы с инцидентами;
- Опыт администрирования любой из перечисленных систем мониторинга: Prometheus, Grafana, Thanos, VictoriaMetrics, Loki, ELK;
- Умение автоматизировать рутину через Python/Golang/Bash;
- Опыт администрирования систем управления репозиториями: Nexus, Artifactory;
- Опыт работы с Docker, Kubernetes, диагностика проблем, эксплуатация и поддержка;
- Опыт работы с Hashicorp-стеком: Vault, Terraform;
- Навыки работы с облаками (AWS, Yandex.Cloud, SberCloud и т.п.) .
Наш основной стек:
- Linux;
- Ansible/Terraform;
- Gitlab;
- Docker и kubernetes;
- Redis, zookeeper, kafka;
- Системы хранения и обработки логов (elasticsearch/logstash/kibana);
- Системы мониторинга (zabbix/prometheus/grafana/thanos);
- Python,bash scripting;
- Sentry;
- СУБД PostgreSQL и Cassandra.
Работа в eXpress - это: