Вакансия: SRE/Site Reliability Engineer в группу инфраструктурных сервисов корпоративного облака в VK Tech
Описание вакансии
VK Cloud это платформа облачных сервисов для бизнеса и разработчиков. С 2018 года мы развиваем облачные сервисы по модели as-a-service в публичных и частных инсталляциях. Наш продукт собственная разработка компании. Мы стремимся построить платформу, которая встанет в один ряд с мировыми гиперскейлерами.
Задачи:
- участие в проектировании и внедрении практик управления инфраструктурой;
- разработка и поддержка автоматизированных систем для реагирования на инциденты, мониторинга и оповещения;
- выполнение плановых регламентных работ;
- участие в on-call дежурствах, в инцидент-менеджменте;
- L3-поддержка пользователей;
- подготовка технической и эксплуатационной документации.
Требования:
- опыт работы с операционными системами семейства Linux на уровне администратора (RHEL, CentOS, RedOS);
- опыт работы с облачной инфраструктурой (VK Cloud, Yandex Cloud, AWS);
- опыт работы с инструментами мониторинга (Prometheus, Grafana, ELK stack);
- опыт работы с СУБД на уровне администратора (MariaDB, PostgreSQL);
- опыт работы с инструментами автоматизации (Ansible, Terraform);
- опыт работы с технологиями виртуализации (KVM).
Будет плюсом:
- опыт работы с OpenStack;
- опыт обслуживания Ceph;
- опыт работы с системами CI/CD (GitLab, Jenkins);
- опыт администрирования etcd, Memcached, Tarantool;
- владение языками программирования (Python, Go).