Laravel. При помощи ИИ программирования создать проксирующий сервис для работы с ИИ (Дистанционная работа)
(проект не опубликован)

Бюджет не указан

Задание: Laravel. При помощи ИИ программирования создать проксирующий сервис для работы с ИИ (Дистанционная работа)

Product Requirement Document (PRD) для сервиса Hubus 1. Executive Summary / Видение продукта: Создать универсальный шлюз для доступа к множеству AI-моделей (LLM, мультимодальные, специализированные), объединяющий лучшие решения от разных провайдеров (Anthropic, OpenAI, Mistral и др.) в едином API, снижая сложность интеграции и оптимизируя затраты. Цели: - Агрегация моделей: поддержка 50+ моделей к релизу. - Упрощение интеграции: единый API-интерфейс и SDK. - Оптимизация стоимости: выбор моделей на основе цены/качества для реализации конкретной задачи. - Повышение надежности: резервирование провайдеров для минимизации downtime. - Удобный запуск: создание web интерфейса с легким переключением между моделями или одновременному обращению к нескольким моделям для тестирования наилучшего результата в ответе. (пример openrouter) - Удобная оплата: Создание единого платёжного кабинета для пользователя при обращении к разным моделям, это пожалуй самая важная задача Сфера применения: - Разработчики: интеграция AI в приложения. - Data Scientists: тестирование и сравнение моделей. - Стартапы: доступ к SOTA-моделям без vendor lock-in. - Корпорации: безопасное управление AI-запросами. Риски: - Зависимость от сторонних API (риск изменений тарифов/правил). - Конкуренция с OpenRouter и прямыми провайдерами. - Сложность поддержки актуальности моделей. --- 2. Product Features / Основные функции: Унифицированный API: Совместимость с OpenAI-форматом для легкой миграции. Поддержка 50+ моделей (текст, изображения, аудио). Динамическая маршрутизация: Автоматический или пользовательский выбор модели под запрос (цена/скорость/качество). Аналитика: Дашборды для мониторинга использования, затрат и производительности. Безопасность: Шифрование данных, аутентификация через OAuth 2.0 и API-ключи. Лимиты и квоты: Настройка лимитов запросов для пользователей/команд. Песочница: Тестирование моделей через веб-интерфейс. Гибкая тарификация: Pay-as-you-go и подписки с кэшбэком за выбор дешевых моделей. Интеграции: Webhooks, Slack-уведомления, синхронизация с Azure/GCP. Пользовательские шаблоны: Preset-промптов и workflow для частых задач. --- 3. User Stories/Use Cases - Разработчик: "Хочу подключить GPT-5 и Claude-3 к своему приложению через один API-ключ, сравнивать стоимость запросов и автоматически выбирать оптимальную модель". - Data Scientist: "Нужно протестировать качество разных моделей на датасете через веб-интерфейс, не прописывая отдельные интеграции". - Стартап-менеджер: "Требуется снизить ежемесячные расходы на AI с $10k до $3k без потери качества ответов". - Администратор безопасности: "Необходимо запретить доступ к моделям с открытым исходным кодом для соблюдения compliance". Сценарии использования: - Реализация многоязычного чат-бота с автоматической маршрутизацией между переводачиками. - Генерация контента с ротацией моделей для избежания rate limits провайдеров. - Пакетная обработка данных через собственный кластер GPU с балансировкой нагрузки. --- 4. UI/UX Design Specifications High-level требования: - Дашборд: - Визуализация затрат, задержек и использования моделей в реальном времени. - Виджеты для быстрой настройки маршрутизации и лимитов. - Model Playground: - Интерфейс с выбором модели, полем для промпта и сравнением ответов. - Возможность сохранять шаблоны запросов. - API-менеджер: - Генерация ключей, настройка IP-фильтров, история запросов. - Дизайн-система: - Минималистичный стиль с акцентом на функциональность. - Темная/светлая тема, адаптивность под мобильные устройства. --- 5. Technical Requirements / Системные требования: - Бекенд: Kubernetes-кластер с автоматическим скейлингом (AWS/GCP). - Кэширование: Redis для частых запросов. - Базы данных: PostgreSQL (метаданные) + TimescaleDB для аналитики. Совместимость: - API: REST + gRPC. - SDK: Python, JavaScript, Go, php. - Поддержка форматов: OpenAI-совместимые запросы, WebSocket для стриминга. Безопасность: - SSL/TLS для передачи данных. - Регулярные аудиты безопасности. - Рольная модель доступа (admin, developer, analyst). - Логирование и аудит действий (сохранение 90 дней). --- 6. Release Criteria // Функциональность: - Работают 20+ моделей, документированный API, базовые настройки безопасности. - Удобство: - Средний рейтинг юзабилити от тестировщиков ≥ 8/10. - Надежность: - Доступность 99.9%, обработка 1000 RPS без деградации. - Производительность: - Средняя задержка ≤ 800 мс для текстовых моделей. --- 7. Success Metrics / Рост: - 10 000 активных пользователей в первый год. - 500 млн обработок запросов/месяц к Q3 2026. - Производительность: - P95 latency < 1.2 сек для 95% моделей. - Серверная доступность > 99.95%. - Бизнес-метрики: - LTV пользователя ≥ $300, CAC < $50. - Партнерства с 3+ крупными провайдерами моделей.