Senior Python Backend Developer (Generative AI / HighLoad) (удаленная работа)

14 декабря 2025

Уровень зарплаты:
от 300 000 до 300 000 руб.
Требуемый опыт работы:
Не указан

Вакансия: Senior Python Backend Developer (Generative AI / HighLoad)

Описание вакансии

Мы ищем опытного инженера в команду ReCrea.ai мобильного приложения для генерации фото и видео. Наш бэкенд это сложная система оркестрации AI-задач, которая управляет обучением LoRA-моделей, генерацией контента через RunPod/Replicate/Fal.ai и обработкой медиа в реальном времени.

Тебе предстоит работать с кодом, который напрямую взаимодействует с GPU-кластерами, обрабатывает тысячи асинхронных колбэков и обеспечивает надежность финансовых транзакций при сбоях генерации.

Технологический стек

Core :

  • Python 3.12 (Asyncio, Pydantic v2, Type hints).
  • FastAPI + Uvicorn + Gunicorn (Custom workers).
  • PostgreSQL + SQLAlchemy 2.0 (Async, JSONB, сложные транзакции).
  • Redis (Кэширование, Pub/Sub для вебсокетов, атомарные счетчики).

AI & Generation Pipeline :

  • Orchestration : Управление долгими задачами (Training, Inference) на RunPod, Replicate, Fal.ai.
  • LLM Integration : Глубокая интеграция с Google Gemini API, OpenRouter (Vision, Chat, Structured Outputs) для улучшения промтов и анализа изображений
  • Media Processing : Pillow, FFmpeg, OpenCV (обработка, конвертация, upscale).

Infrastructure & Observability :

  • Blue-Green Deployment (Nginx, Docker Compose).
  • Monitoring : Grafana, Loki, Prometheus, Structlog (JSON logs), OpenTelemetry.
  • Storage : S3 (Yandex/DigitalOcean)

Ключевые задачи

1. Оркестрация AI-процессов (Core Logic):

  • Развитие сервисов ModelService и PhotoService : управление жизненным циклом обучения моделей (LoRA) и генерации изображений.
  • Реализация надежных механизмов Retry и Fallback для внешних GPU-провайдеров (RunPod, Fal.ai).
  • Обработка сложных сценариев Race Conditions в асинхронных вебхуках (например, при параллельном апскейле изображений).

2. Стабилизация и оптимизация :

  • Устранение утечек соединений с БД (Connection Leaks) в высоконагруженных асинхронных воркерах.
  • Оптимизация работы с S3 и сетью: параллельная загрузка, обработка таймаутов, работа с большими файлами.
  • Улучшение системы возврата средств (Refunds) при сбоях генерации (гарантия консистентности баланса пользователя).

3. Развитие продукта:

  • Интеграция новых ИИ моделей и пайплайнов (Image-to-Video, Text-to-Video).
  • Разработка фичей на базе LLM: автоматическое улучшение промтов, генерация описаний, чат-боты.
  • Поддержка системы подписок и рекуррентных платежей (Tinkoff, Stripe, RevenueCat).

Требования

  • Python Expert: Глубокое понимание asyncio , работы с Event Loop, конкурентности и многопоточности.
  • Database : Опыт работы с PostgreSQL на уровне оптимизации запросов, понимание уровней изоляции транзакций и блокировок (для предотвращения Race Conditions).
  • Architecture: Умение проектировать отказоустойчивые распределенные системы (обработка сбоев, идемпотентность, очереди задач).
  • Debugging: Навык расследования сложных багов в распределенной системе с помощью логов (Loki) и трейсов.

Будет плюсом

  • Опыт работы с Generative AI (Stable Diffusion, ComfyUI, LLM).
  • Понимание принципов работы GPU-облаков (RunPod, Lambda).
  • Опыт работы с вебсокетами (реализация прогресс-баров и уведомлений).

Почему это круто

  • Real AI Product: Ты будешь работать с технологиями, которые меняют индустрию прямо сейчас (Flux, Google, Gemini, Sora).
  • High Impact : Ваш код будет напрямую влиять на качество генерации и опыт тысяч пользователей.
  • Modern Stack : Мы используем последние версии библиотек и инструментов, не боимся экспериментировать и внедрять новое.