Reliability Lead ЦП SRE (удаленная работа)
(вакансия в архиве)

28 декабря 2023

Уровень зарплаты:
з.п. не указана
Требуемый опыт работы:
Не указан

Вакансия: Reliability Lead ЦП SRE

Описание вакансии

МТС Digital сердце цифровой экосистемы МТС. 12 гильдий инженеров, суперкомпьютер, системы видеоаналитики, IoT, собственная лаборатория AI и 20+ петабайт данных. Финтех, стриминг, гейминг, мобильные приложения, облачные сервисы. Каждый день мы работаем над тем, чтобы вывести мобильную и веб-разработку на новый уровень, благодаря сплоченным продуктовым командам и agile методологиям.

Сейчас мы в поиске специалиста, чья главная задача помочь нам выстроить и внедрить единые подходы к обеспечению надежности продуктов, сервисов и систем в рамках Экосистемы МТС.

Чем предстоит заниматься:

  • выстраивать единую методологию управления надежностью для Экосистемы МТС, включая подходы к:

- определению классов критичности систем и сервисов на основе влияния их простоя на бизнес-процессы Экосистемы;
- оценке экономически-обоснованных значений RTO и RPO;
- формированию системы продуктовых метрик в части обеспечения надежности;
- выстраиванию процессов управления уровнем сервиса на основе SLA/SLO/SLI;
- обеспечению непрерывности и доступности критичных для экосистемы систем и сервисов;
- управлению критическими событиями в продуктивной среде.

Что мы ожидаем от тебя:
  • опыт работы в ИТ от 10 лет;

  • опыт работы на позиции лидера практики SRE в крупных технологических компаниях;

  • наличие управленческого опыта (управление командой не менее 10 человек);

  • опыт разработки SLA/SLI/SLO и знание принципов их формирования;

  • практический опыт локализации проблем и устранения инцидентов в больших и сложных системах;

  • опыт внедрения практик и инструментов SRE и DevOps;

  • опыт построения отказоустойчивых распределенных хранилищ на базе Cassandra, Mongo, Postgres, Ignite, Elastic;

  • опыт встраивания процессов / процедур обеспечения надежности в типовые процессы экплуатационных приложений;

  • практический опыт внедрения практик и инструментов Capacity Management, Availability Management, Business Continuity Management;

  • опыт организации построения или управления инфраструктурой отказоустойчивых систем, работающих в режиме 24x7x365 и требующих минимального участия человека;

  • знание принципов работы SCM систем и современных средств мониторинга и автоматизации управления инфраструктурой;

  • знание принципов и методов обеспечения качества и надёжности ИТ сервисов;

  • отличные коммуникационные навыки;

  • английский не ниже Intermediate.

Что мы предлагаем:

  • собственную платформу MTS Ocean для получения ИТ-ресурсов, а это значит, что деплой, мониторинг, observability - не будут для вас проблемой, вы сможете сосредоточиться на фичах;
  • профессиональные гильдии инженеров по направлениям, чтобы поддерживать друг друга и обмениваться опытом;
  • внутреннюю площадку TechTalks для обмена опытом, дискуссий, развития навыков самопрезентации;
  • участие во внешних IT конференциях. Мы выступаем на HighLoad++, DataFest, Mobius, Test Driven Conf, Joker, DevOps, Матемаркетинг и даже проводим собственную конференцию по архитектуре Hello, conference!
  • полезные курсы и вебинары в корпоративном университете и электронные библиотеки.

А еще:

  • медицинскую страховку с 1 месяца со 100% покрытием расходов, включая стоматологию, страхование жизни и здоровья в поездках за рубеж. А еще можно застраховать родственников с корпоративной скидкой;
  • доступ к сервису Понимаю : онлайн-консультации с психологом, юристом, экспертом по финансам или ЗОЖ;
  • корпоративный и командный психолог в офисе и массажный кабинет;
  • единую подписку МТС Premium KION light в онлайн-кинотеатре KION, сервис МТС Music, 30 дней бесплатного пользования подпиской OZON Premium;
  • скидки и предложения от партнеров на фитнес, занятия английским и прочее.