Go-разработчик, Группа разработки трейсинга и профилирования (удаленная работа)

7 июня 2026

Уровень зарплаты:
з.п. не указана
Требуемый опыт работы:
Не указан

Вакансия: Go-разработчик, Группа разработки трейсинга и профилирования

Описание вакансии

Привет! Это команда разработки трейсинга и профилирования

Наша команда строит платформу трейсинга на базе опенсорс решения OpenTelemetry и Jaeger. Мы планируем переходить на собственную реализацию, для сокращения потребления ресурсов. Добавляем новые фичи, тем самым предоставляя более качественный и очень важный продукт для всех разработчиков Ozon.

Наш стек

  • Golang, Kubernetes, Prometheus, Grafana, OpenTelemetry/Jaeger.

Вы будете

  • Улучшать функционал сэмплирования трейсов, чтобы собирать только важные, ценные трейсы и при этом держать трафик в районе 10-12 Гб в секунду.
  • Поддерживать, оптимизировать и масштабировать графы зависимостей.
  • Добавлять новый функционал.
  • Осуществлять полный переход на OpenTelemetry, отказ от Jaeger.
  • Сохранять больше трейсов во время нагрузочного тестирования.
  • Улучшать поиск трейсов: возможность находить аномалии, отклонения, потенциальные проблемы по трейсам в интерфейсе трейсинга.
  • Улучшать платформенную библиотеку: обогащение новым функционалом.
  • Поддерживать и развивать другие связанные компоненты трейсинга.
  • Поддерживать трейсинга в банковском контуре.
  • Осуществлять интеграцию с алертингом, мониторингом, сервисом непрерывного сбора профилей.
  • Осуществлять интеграцию с AI и много ресерчить.

Нам важно

  • Опыт разработки на Go и умение писать чистый, поддерживаемый и производительный код.
  • Опыт написания unit-тестов.
  • Опыт разработки высоконагруженных, отказоустойчивых распределённых систем.
  • Знание Docker и Kubernetes на уровне создания и управления ресурсами, анализа логов и работы с контейнерами.
  • Опыт работы с CI/CD-инструментами.
  • Понимание принципов работы Unix-подобных операционных систем.
  • Опыт работы с системами мониторинга и наблюдаемости, включая Prometheus и Grafana.
  • Знание Helm, Qbec или Kustomize.

Почему у нас может быть интересно

  • Мы активно улучшаем существующую платформу трейсинга на базе OpenTelemetry и Jaeger и начали процесс переезда на собственное решение.
  • У нас один из самых высоконагруженных сервисов в компании. Агенты для сбора трейсов установлены на около 3000 серверов, которые в пике отправляют 10Gb трейсов в секунду.
  • Коллекторам выделено порядка 22Tb оперативной памяти и 2700 ядер.
  • У нас много ресерча существующих решений, а также активно думаем над новыми фичами, интеграциями, чтобы облегчить поиск узких, аномальных мест нашим разработчикам.
  • Мы используем свою базу данных, которая изначально была разработана под хранение логов. Есть возможность оптимизировать части связанные с хранение, поиском и так далее.
  • Наш продукт настроен и оптимизирован так, чтобы переживать DC-1.
  • Мы сами разворачиваем большинство компонентов в k8s кластерах, что дает полное понимание, как работает система.


Посмотрите похожие вакансии