Задание: Laravel. При помощи ИИ программирования создать проксирующий сервис для работы с ИИ (Дистанционная работа)
Product Requirement Document (PRD) для сервиса Hubus
1. Executive Summary / Видение продукта:
Создать универсальный шлюз для доступа к множеству AI-моделей (LLM, мультимодальные, специализированные), объединяющий лучшие решения от разных провайдеров (Anthropic, OpenAI, Mistral и др.) в едином API, снижая сложность интеграции и оптимизируя затраты.
Цели:
- Агрегация моделей: поддержка 50+ моделей к релизу.
- Упрощение интеграции: единый API-интерфейс и SDK.
- Оптимизация стоимости: выбор моделей на основе цены/качества для реализации конкретной задачи.
- Повышение надежности: резервирование провайдеров для минимизации downtime.
- Удобный запуск: создание web интерфейса с легким переключением между моделями или одновременному обращению к нескольким моделям для тестирования наилучшего результата в ответе. (пример openrouter)
- Удобная оплата: Создание единого платёжного кабинета для пользователя при обращении к разным моделям, это пожалуй самая важная задача
Сфера применения:
- Разработчики: интеграция AI в приложения.
- Data Scientists: тестирование и сравнение моделей.
- Стартапы: доступ к SOTA-моделям без vendor lock-in.
- Корпорации: безопасное управление AI-запросами.
Риски:
- Зависимость от сторонних API (риск изменений тарифов/правил).
- Конкуренция с OpenRouter и прямыми провайдерами.
- Сложность поддержки актуальности моделей.
---
2. Product Features / Основные функции:
Унифицированный API: Совместимость с OpenAI-форматом для легкой миграции.
Поддержка 50+ моделей (текст, изображения, аудио).
Динамическая маршрутизация: Автоматический или пользовательский выбор модели под запрос (цена/скорость/качество).
Аналитика: Дашборды для мониторинга использования, затрат и производительности.
Безопасность: Шифрование данных, аутентификация через OAuth 2.0 и API-ключи.
Лимиты и квоты: Настройка лимитов запросов для пользователей/команд.
Песочница: Тестирование моделей через веб-интерфейс.
Гибкая тарификация: Pay-as-you-go и подписки с кэшбэком за выбор дешевых моделей.
Интеграции: Webhooks, Slack-уведомления, синхронизация с Azure/GCP.
Пользовательские шаблоны: Preset-промптов и workflow для частых задач.
---
3. User Stories/Use Cases - Разработчик:
"Хочу подключить GPT-5 и Claude-3 к своему приложению через один API-ключ, сравнивать стоимость запросов и автоматически выбирать оптимальную модель".
- Data Scientist:
"Нужно протестировать качество разных моделей на датасете через веб-интерфейс, не прописывая отдельные интеграции".
- Стартап-менеджер:
"Требуется снизить ежемесячные расходы на AI с $10k до $3k без потери качества ответов".
- Администратор безопасности:
"Необходимо запретить доступ к моделям с открытым исходным кодом для соблюдения compliance".
Сценарии использования:
- Реализация многоязычного чат-бота с автоматической маршрутизацией между переводачиками.
- Генерация контента с ротацией моделей для избежания rate limits провайдеров.
- Пакетная обработка данных через собственный кластер GPU с балансировкой нагрузки.
---
4. UI/UX Design Specifications
High-level требования:
- Дашборд:
- Визуализация затрат, задержек и использования моделей в реальном времени.
- Виджеты для быстрой настройки маршрутизации и лимитов.
- Model Playground:
- Интерфейс с выбором модели, полем для промпта и сравнением ответов.
- Возможность сохранять шаблоны запросов.
- API-менеджер:
- Генерация ключей, настройка IP-фильтров, история запросов.
- Дизайн-система:
- Минималистичный стиль с акцентом на функциональность.
- Темная/светлая тема, адаптивность под мобильные устройства.
---
5. Technical Requirements / Системные требования:
- Бекенд: Kubernetes-кластер с автоматическим скейлингом (AWS/GCP).
- Кэширование: Redis для частых запросов.
- Базы данных: PostgreSQL (метаданные) + TimescaleDB для аналитики.
Совместимость:
- API: REST + gRPC.
- SDK: Python, JavaScript, Go, php.
- Поддержка форматов: OpenAI-совместимые запросы, WebSocket для стриминга.
Безопасность:
- SSL/TLS для передачи данных.
- Регулярные аудиты безопасности.
- Рольная модель доступа (admin, developer, analyst).
- Логирование и аудит действий (сохранение 90 дней).
---
6. Release Criteria // Функциональность:
- Работают 20+ моделей, документированный API, базовые настройки безопасности.
- Удобство:
- Средний рейтинг юзабилити от тестировщиков ≥ 8/10.
- Надежность:
- Доступность 99.9%, обработка 1000 RPS без деградации.
- Производительность:
- Средняя задержка ≤ 800 мс для текстовых моделей.
---
7. Success Metrics / Рост:
- 10 000 активных пользователей в первый год.
- 500 млн обработок запросов/месяц к Q3 2026.
- Производительность:
- P95 latency < 1.2 сек для 95% моделей.
- Серверная доступность > 99.95%.
- Бизнес-метрики:
- LTV пользователя ≥ $300, CAC < $50.
- Партнерства с 3+ крупными провайдерами моделей.