Задание: Генерация изображений. Разработка AI-системы для генерации карточек товара для маркетплейсов (Дистанционная работа)
Нужно разработать систему, которая будет работать на нашем сервере и помогать создавать визуальные карточки товара для маркетплейсов: Ozon, Wildberries, Яндекс Маркет и т. п.
Общая логика системы:
1. Менеджер загружает или вводит данные по товару:
— фото товара;
— характеристики;
— преимущества;
— целевая аудитория;
— стиль бренда;
— требования к текстам, цветам, инфографике, композиции;
— примеры хороших карточек, если есть.
2. Система сначала генерирует идеи для карточек:
— какие слайды нужны;
— какие смыслы раскрыть;
— какие акценты сделать;
— какой визуальный стиль использовать;
— какие тексты вынести на изображения.
3. Затем система подробно описывает визуальную концепцию каждой карточки:
— композиция;
— расположение товара;
— фон;
— инфографика;
— текстовые блоки;
— иконки;
— цветовая схема;
— что должно быть в кадре и чего быть не должно.
4. После этого система генерирует сами изображения карточек, используя подходящие нейросети/API/модели, а также умеет накладывать текст по заданным правилам.
5. Менеджер видит результат в интерфейсе и может дать обратную связь обычным текстом:
«товар исказился», «сделай фон светлее», «текст слишком мелкий», «добавь больше премиальности», «убери лишние элементы», «сохрани товар точнее» и т. д.
6. Система учитывает обратную связь и генерирует следующую версию карточки.
**Очень важные требования:**
Нам нужен не просто программист, который “подключит генерацию картинок”. Нужен человек, который уже работал с подобными задачами и понимает специфику генерации коммерческих карточек товара.
Особенно важно:
— уметь сохранять внешний вид товара, чтобы нейросеть не меняла форму, цвет, детали, логотип, пропорции;
— понимать, как лучше использовать reference image / image-to-image / inpainting / ControlNet / LoRA / другие подходы для сохранения товара;
— уметь делать карточки с текстом так, чтобы текст был читаемым, аккуратным и соответствовал правилам;
— понимать, что часть текста, возможно, лучше накладывать не самой нейросетью, а отдельным этапом через графический движок/шаблоны;
— уметь строить пайплайн: идея → промпт → генерация → постобработка → наложение текста → проверка → правки;
— понимать ограничения разных моделей и уметь выбирать оптимальные инструменты под задачу;
— уметь сделать интерфейс для менеджера, чтобы он мог работать с системой без программирования.
**Что хотим получить на первом этапе:**
MVP-систему, где можно:
1. создать товарный проект;
2. загрузить фото и описание товара;
3. сгенерировать идеи карточек;
4. получить визуальное описание каждой карточки;
5. сгенерировать изображения;
6. наложить текст;
7. дать обратную связь через промпт;
8. получить новую версию;
9. сохранить/скачать готовые варианты.
**Технологии можно предлагать свои.**
Главное — чтобы решение было рабочим, расширяемым и размещалось на нашем сервере. Можно использовать сторонние API нейросетей, open-source модели, локальные модели, очереди задач, веб-интерфейс, базу данных и т. д.
**Кандидату обязательно нужно показать релевантный опыт.**
В отклике просьба написать:
1. Делали ли вы уже похожие системы для генерации товарных изображений, карточек, баннеров, креативов или инфографики?
2. Какие модели/инструменты использовали?
3. Как решали проблему сохранения товара без искажений?
4. Как решали проблему качественного наложения текста?
5. Можете ли показать примеры работ, демо, скриншоты или хотя бы описать реализованный пайплайн?
6. Какой подход предложили бы для нашего MVP?
7. Какие риски видите в такой задаче?
Важно: отклики без релевантного опыта и понимания AI image generation для коммерческих карточек товара рассматривать не будем.