Вакансия: Senior Ceph Engineer
Описание вакансии
В подведомственную организацию Министерства государственного управления, информационных технологий и связи Московской области ГКУ МО МОЦ ИКТ требуется Senior Ceph Engineer .
МОЦ ИКТ Московский областной центр информационно-коммуникационных технологий.
Основные цели компании:
развитие и эксплуатация информационно-телекоммуникационной инфраструктуры Правительства Московской области и обеспечение органов государственной власти Московской области услугами связи и вычислительными ресурсами эксплуатируемых центров обработки данных;
развитие проектов в сфере искусственного интеллекта;
организация централизованного обеспечения органов государственной власти Московской области средствами вычислительной техники, программными и цифровыми продуктами и сервисами.
Ключевые задачи учреждения включают:
обеспечение работы единой интегрированной мультисервисной телекоммуникационной сети и единой инфраструктуры технологического обеспечения Правительства Московской области;
поддержка и развитие телефонии Правительства Московской области;
реализация комплекса мер по импортозамещению в сфере IT в регионе;
функционирование единой службы поддержки пользователей и контроль качества предоставляемых услуг;
организация закупок товаров и услуг для обеспечения функционирования информационных систем Правительства МО, а также централизованное обеспечение центральных исполнительных органов и государственных органов Московской области средствами вычислительной и организационной техники;
поддержка рабочих мест сотрудников Правительства МО;
поддержка систем, обеспечивающих предоставление государственных и муниципальных услуг, и контроль их качества;
эксплуатация Центров обработки данных Правительства Московской области;
реализация региональных проектов в сфере ИТ.
Ключевые проекты:
Прогрессивный ЦОД Правительства Московской области ;
региональный проект Отечественные решения ;
Колл-центры Правительства Московской области и другие.
Задачи:
- Проектировать, развертывать и поддерживать кластеры Ceph в продакшн-средах, обеспечивая их высокую доступность, масштабируемость и отказоустойчивость.
- Оптимизировать производительность Ceph-кластеров: настройка CRUSH-карт, выбор оптимальных пулов, тюнинг параметров, оптимизация под нагрузку разных типов (RBD, RGW, CephFS).
- Выполнять мониторинг состояния кластеров, анализировать метрики (ceph metrics, Prometheus, Grafana и др.), своевременно выявлять и устранять проблемы.
- Проводить планирование ёмкости и масштабирования: прогнозировать рост данных, вовремя добавлять новые OSD, мониторить состояние и производительность оборудования.
- Разрабатывать стратегии резервного копирования, восстановления и миграции данных в рамках Ceph.
- Интегрировать Ceph с другими компонентами инфраструктуры, включая Kubernetes (через Rook или CSI-плагины), а также с системами виртуализации (OpenStack, KVM, VMware).
- Обеспечивать безопасность и целостность данных: настройка аутентификации, шифрования, контроль доступа и регулярный аудит настройки.
Требования:
Глубокое понимание Ceph:
- Практический опыт установки, конфигурирования и эксплуатации кластеров Ceph в продакшне.
- Знание архитектуры Ceph (MON, OSD, MDS, RGW), их роли и принципов взаимодействия.
- Опыт настройки и оптимизации CRUSH-карт, пулов, PG и PG placement групп.
- Понимание CephFS, RBD, RGW, их применения и кейсов использования.
Производительность и отладка:
- Умение диагностировать узкие места в производительности (IO latency, network throughput, дисковая подсистема).
- Опыт использования инструментов мониторинга (Ceph Dashboard, Prometheus, Grafana) и логирования для анализа поведения кластера.
Сетевые технологии и оборудование:
- Знание сетевых топологий и протоколов, применимых для высокопроизводительных систем хранения (LACP, VLAN, RDMA, RoCE, InfiniBand).
- Опыт оптимизации сетевых настроек для минимизации задержек и увеличения пропускной способности.
Интеграция с другими системами:
- Опыт интеграции Ceph с Kubernetes (Rook), OpenStack (Cinder, Glance, Nova), а также с иными системами хранения и оркестрации.
- Понимание CSI-драйверов для Ceph и особенности их применения в контейнерных окружениях.
Безопасность и отказоустойчивость:
- Знание механизмов аутентификации Ceph (Cephx), шифрования данных на уровне OSD, бэкапов и восстановления.
- Опыт проектирования решений высокой доступности, а также аварийного переключения (Disaster Recovery).
Автоматизация и IaC:
- Приветствуется опыт использования Ansible, Terraform или других IaC-инструментов для автоматизации развертывания и управления Ceph-кластерами.
- Навыки скриптинга (Python, Bash, Go) для автоматизации рутинных операций.
Личные качества:
- Аналитический склад ума, умение быстро находить и устранять причины проблем с производительностью или стабильностью.
- Способность работать в команде, взаимодействовать с разработчиками и специалистами по инфраструктуре, объясняя сложные технические аспекты доступным языком.
- Готовность к обучению и использованию новых технологий и инструментов.
- Внимательность к деталям, аккуратность в документации и описание процедур.
Дополнительные плюсы:
- Опыт работы с другими системами распределённого хранения (GlusterFS, Lustre).
- Знание Kubernetes на продвинутом уровне, умение работать с Helm, ArgoCD.
- Опыт интеграции CI/CD инструментов для управления инфраструктурными изменениями.
Условия работы:
- работа аккредитованной ИТ-компании;
- участие в реализации значимых цифровых проектов регионального уровня;
- оформление по ТК РФ;
- конкурентный и стабильный уровень оплаты труда + премии по итогам работы;
- профессиональный и карьерный рост;
- удаленный формат работы, комфортный офис в Бизнес-центре класса А (станция м. Мякинино, 7 минут пешком);
- дружный коллектив.