Вакансия: Site Reliability Engineering (SRE) / DevOps
Всем привет! На связи команда Центра развития ИТ-образования Московского физико-технического института.
Мы организовываем образовательные фестивали, направленные на популяризацию науки, турниры и олимпиады, конференции, курсы повышения квалификации (ДПО), онлайн-курсы и многое другое.
Больше трех лет минимальной командой разрабатываем свою образовательную платформу - LMS. До текущего момента фокусировались на функциональности (закрывали потребности бизнеса), теперь фокус на автоматизации разработки, выдерживании нагрузки (uptime) и показателях. Ищем человека, который поможет настроить автоматизацию разработки и масштабирование (20к+ активных пользователей в онлайне), а дальше будет следить за тем, чтобы инцидентов было как можно меньше.
Стек: Php, Vue.js, Python, MariaDB, MongoDB, Nginx, Kubernetes, Docker, Grafana, Prometeus, Zabbix, Redis, Memcached, GitLab
Чем предстоит заниматься:
- Администрирование Linux серверов (Debian, Centos);
- Настройка, тюнинг производительности и работы по отказоустойчивости, в первую очередь речь о Nginx, Php, MariaDB
- Взаимодействие с разработчиками;
- Развертывание/кластеризация сервисов (Kebernetes);
- Работа с бэкапами;
- Мониторинг, оптимизация инфраструктуры и сервисов;
- Выявление проблем и “узких мест” системы, их решение;
- Оперативная реакция на инциденты;
- Автоматизация регулярных задач.
У нашего идеального кандидата:
- опыт работы SRE/DevOps, системным/сетевым администратором, инженером IT-эксплуатации от 3-х лет;
- готовность работать с нашим стеком (смотри выше), а иногда настраивать все с нуля;
- базовый опыт программирования на любом языке;
- высокий уровень самостоятельности.