Редактирование фотоOpenAIРелиз: 15 сентября 2025

GPT-Image-2редактирование фото

Модель OpenAI для редактирования и генерации фото по промпту. Аккуратный текст на изображении, inpaint с маской и продуктовые сцены без артефактов.

0рейтинг
Официальный сайт: openai.com/index/introducing-4o-image-generation
Попробовать на PhotoPandaот 7 ₽ за фото (medium)

Характеристики GPT-Image-2

Разработчик
OpenAI
Категория
Редактирование фото
Дата релиза
15 сентября 2025
Семейство
GPT Image
I/O режимы
Текст → фотоФото → фото
Доступ из РФ
✅ Через PhotoPanda без VPN

Возможности

  • Точный текст и типографика внутри изображения
  • Inpaint с маской и alpha-каналом
  • Три уровня качества: low, medium, high
  • Форматы 1024×1024, 1024×1536, 1536×1024, 2048×2048 (high)
  • Замена фона с пересчётом теней и бликов
  • Понимание длинных многосоставных промптов (GPT-4o)
  • Стилизация: иллюстрация, акварель, изометрия
  • Поддержка до 4 референсных изображений в input
  • Продуктовая съёмка с логотипами и ценниками
  • Английский и кириллический текст в кадре

GPT-Image-2 в бенчмарках и тестах

Результаты из известных систем оценки и независимых leaderboard'ов. Цифры берутся из официальных публикаций разработчика и публичных бенчмарков.

Image Arena Elo

437

Лидер рейтинга генеративных нейросетей по человеческой оценке (May 2026), обогнал GPT Image 1.5 (237) и Midjourney V7.

Источник: llm-stats.com/leaderboards/best-ai-for-image-generation · 2026-05-01

GenEval — color recognition

0.92

Точность цветовой композиции по GenEval (модель верно различает и применяет цвета объектов).

Источник: arxiv.org/abs/2504.02782 — GPT-ImgEval · 2025-04-01

GenEval — counting

0.85

Точность счёта объектов: модель правильно генерирует заданное количество предметов в кадре.

Источник: arxiv.org/abs/2504.02782 — GPT-ImgEval · 2025-04-01

GenEval — spatial localization

0.75

Пространственное размещение объектов по промпту (лево/право/над/под) — значимый отрыв от DALL-E 3.

Источник: arxiv.org/abs/2504.02782 — GPT-ImgEval · 2025-04-01

Что это

GPT-Image-2: нейросеть OpenAI для точного редактирования фото

GPT-Image-2 — это флагманская ИИ-модель OpenAI для генерации и редактирования изображений по тексту, выпущенная 15 сентября 2025 года. Она пришла на смену gpt-image-1 (апрель 2025) и подняла качество типографики, inpaint по маске и многошаговых промптов до production-уровня.

В отличие от Nano Banana, которая делает ставку на multi-image композицию и фотореализм, GPT-Image-2 сфокусирована на управлении мелкими деталями — текстом, бейджами, ценниками, логотипами внутри сцены. Это сделало нейросеть де-факто стандартом в e-commerce и маркетинговой графике с надписями.

Главные цифры

Что важно знать про возможности и цены перед стартом.

2048×2048
Максимальное разрешение (high)

На уровне low/medium — до 1536×1024 или 1024×1536. High добавляет 2K-вывод.

#1
Image Arena Elo 437

Первое место среди генеративных моделей (май 2026), обогнала GPT Image 1.5 и Midjourney v7.

$0,02–0,25
Цена за изображение

Low ~$0,02, medium ~$0,07, high до $0,25 за фото 1K через OpenAI API.

3
Уровня качества рендера

Low — для черновиков, medium — для production, high — для печати и баннеров.

Что умеет нейросеть GPT-Image-2

Шесть способностей, ради которых маркетологи и дизайнеры берут модель вместо Midjourney и Flux.

Точный текст в кадре

Рендерит надписи без артефактов на латинице и кириллице — слоганы, ценники, бейджи, заголовки постеров. Главное преимущество над Midjourney.

Inpaint по маске

Принимает alpha-канал и точечно редактирует только выделенную зону. Замена объекта, ретушь лица, перекрашивание одежды — без потери остальной картинки.

Три уровня качества

Low за $0,02 для черновиков, medium ~$0,07 — рабочая лошадка для большинства задач, high до $0,25 — для печати и постеров 2K.

Продуктовая съёмка

Собирает studio-style композиции с логотипами, ценниками и упаковкой. Понимает «product shot на белом», «бренд X на коробке», «тень снизу-справа».

Многосоставные промпты

Наследует мультимодальное понимание от GPT-4o. Длинный промпт «убери фон, замени на студию, добавь логотип, текст SALE 50%» отрабатывает шаг за шагом.

Замена фона с пересчётом света

При подмене бекграунда модель пересчитывает тени, блики и цветовую температуру — субъект не выглядит «приклеенным» к новой сцене.

Чем GPT-Image-2 отличается от Nano Banana Pro, Midjourney и Flux

Wordstat показывает активный запрос «gpt image 2 vs midjourney» — собрали таблицу с тремя конкурентами на одном экране.

ПараметрЭта модельNano Banana ProMidjourney v7Flux 1.1 Pro
Релизсентябрь 2025ноябрь 2025июнь 2025октябрь 2024
Максимальное разрешение2048×2048 (high)4K (3840×2160)2048×20482048×2048
Точность текста в кадреОтличноОтличноПлохоУдовлетворительно
Inpaint по маскеНативный alpha-каналБазовыйVary RegionБазовый
Multi-image (референсы)До 4 фотоДо 14 фотоДо 5 фотоДо 4 фото
Цена за фото (medium / standard)~$0,07$0,134$0,02/час кредитов$0,055
Следование длинному промптуОтлично (GPT-4o)ХорошоУдовлетворительноХорошо
Доступ из РФЧерез посредниковVPN или посредникиVPNЧерез посредников

Если нужно собрать рекламный креатив с надписями, точечно отредактировать фото по маске или прогнать длинный многошаговый промпт — GPT-Image-2. Для 4K портретов и multi-image композиций — Nano Banana Pro. Для художественных стилей — Midjourney v7.

Как попробовать GPT-Image-2 из России

Прямой OpenAI API не работает с российских IP и не принимает карты МИР. Команда PhotoPanda встроила модель в каталог инструментов — это самый быстрый рабочий путь.

  1. 1

    Откройте AI-редактор в PhotoPanda

    На photopanda.ru → раздел «Редактирование фото ИИ». Модель подключена под именем gpt-image-2 по фиксированной цене за фото в рублях. Без VPN и зарубежных карт.

  2. 2

    Получите приветственный бонус

    Регистрация без карты, по email или Telegram. На баланс зачисляется 25 ₽ — хватает на 3–4 генерации medium-качества для теста.

  3. 3

    Загрузите исходник и опишите задачу

    Можно подать фото для редактирования (inpaint с маской прямо в кабинете) или просто промпт для генерации. Поддерживается русский и английский язык.

  4. 4

    Скачайте результат за 15–40 сек

    Файл сохраняется в /app/results, доступен для скачивания и хранится в истории. При желании прогнать через апскейл SeedVR2 до 4K — ещё 1–3 ₽ за фото.

Промпт-советы для GPT-Image-2

Эти приёмы дают +30–50% к качеству результата по нашим внутренним замерам PhotoPanda.

Совет

Структурируйте промпт

Шаблон: «scene + subject + action + lighting + camera + style». GPT-Image-2 отлично понимает технические термины фото и продуктовой съёмки.

Совет

Текст пишите в кавычках

Для надписей внутри сцены: «на упаковке текст “Натуральный йогурт 500 г” крупным шрифтом». Модель почти не путает буквы на коротких фразах.

Совет

Используйте маску для точечной правки

Inpaint через alpha-канал — белая зона маски = что менять, чёрная = что сохранить. Плавные градиенты дают мягкие переходы без резких границ.

Совет

На русском пишите коротко, на английском — детально

Кириллический промпт работает, но датасет OpenAI преимущественно англоязычный. Сложные технические описания (камеры, плёнки, освещение) — на английском.

Совет

Выбирайте уровень качества под задачу

Low ($0,02) — для итераций по композиции, medium ($0,07) — production, high ($0,25) — печать и баннеры. Не переплачивайте за high на черновиках.

Совет

Длинные кириллические фразы делайте отдельно

На надписях больше 5–7 слов модель допускает ошибки. Лучше сгенерировать сцену без текста и наложить надпись шаблоном в Figma или Canva.

Плюсы и минусы GPT-Image-2

Плюсы
  • Лидер Image Arena Elo 437
    Первое место среди генеративных нейросетей по человеческой оценке. Обогнала GPT Image 1.5 (237) и Midjourney v7.
  • Точный текст и inpaint по маске
    Главные технические преимущества — корректный рендер надписей и edit по выделенной области без потери остального кадра.
  • Три уровня качества под бюджет
    От $0,02 за low (черновики) до $0,25 за high (печать) — гибкая экономика под разные задачи.
  • Понимание GPT-4o под капотом
    Мультимодальная архитектура отлично слышит длинные многошаговые промпты, которые DALL-E 3 переписывал и упрощал.
Минусы
  • Прямой OpenAI API закрыт в РФ
    Блокировка IP и отказ от карт МИР. Прямой доступ из России — только через VPN с иностранной картой или посредников.
  • Кириллица хуже латиницы
    Длинные русские фразы (>5–7 слов) часто ломаются. Для рекламы с большим объёмом русского текста — накладывать поверх шаблоном.
  • До 4 input-фото
    Для multi-image композиций (виртуальная примерка, объединение сцен) Nano Banana с её 14 референсами заметно сильнее.
  • Жёсткая цензура OpenAI
    Отказы на известных людей, NSFW, политику и оружие — строже, чем у open-source альтернатив типа Flux и SDXL.

Где применяется GPT-Image-2

Реальные сценарии использования модели — от продуктовой съёмки и маркетплейсов до семейных фотосессий и художественных проектов.

Карточки товаров для маркетплейсов

Замена фона на белый, добавление инфографики, бейджи скидок и характеристик. Готовые карточки для Wildberries и Ozon за минуты.

Рекламные креативы с текстом

Баннеры для Яндекс.Директа, обложки соцсетей, постеры с читаемыми надписями и логотипами бренда внутри картинки.

Продуктовая съёмка без студии

Studio-style композиции с тенями, бликами и упаковкой. Помещает продукт в любую сцену с сохранением фирстиля.

Inpaint и ретушь по маске

Точечное редактирование зон: убрать дефект, заменить элемент, поменять цвет одежды без потери остального кадра.

Иллюстрации для блогов и лендингов

Hero-картинки статей, обложки кейсов, иконки и стикеры в едином стиле. Заменяет покупку на Shutterstock.

Обложки YouTube и Telegram

Превью с крупным текстом, эмоцией героя и фоном бренда. Точный рендер кириллицы делает модель практичной для русскоязычного контента.

Дизайн упаковки и этикеток

Прототипы дизайна банок, коробок, бутылок с реальным брендингом. Полезно для маркетинговых тестов до печати.

Серийная генерация по шаблону

Один промпт-шаблон плюс список вариаций даёт сотню креативов за час: разные товары, цвета, акции.

Сколько стоит GPT-Image-2

Тариф: от $0,02 за изображение — прямой OpenAI API
ТарифПараметрыЦена
Low1024×1024 · черновики и итерации по композиции~$0,02/ фото
Medium1024×1024 · рабочий стандарт для production~$0,07/ фото
Highдо 2048×2048 · печать, постеры, баннерыдо $0,25/ фото
Вертикальный / горизонтальный формат1024×1536 или 1536×1024 · сториз и обложки+30–50%к тарифу
Free tierБесплатного тарифа у OpenAI на эту модель нетНет
  • Цены указаны в долларах США по официальному прайсу OpenAI на 2026-01.
  • Время генерации: 8–15 сек для low, 15–25 сек для medium, 25–40 сек для high.
  • Безлимитного тарифа нет — оплата строго pay-as-you-go по числу изображений.
  • При оплате через посредников из РФ добавляется наценка 30–50% к долларовой цене.
Россия 🇷🇺

Как использовать GPT-Image-2 в России и можно ли оплатить

Доступ
Доступна через PhotoPanda
Оплата из РФ
Оплата с баланса PhotoPanda

Прямой доступ к OpenAI API из России закрыт

OpenAI блокирует регистрацию аккаунтов с российских IP, не принимает карты, выпущенные банками РФ (включая МИР), и периодически банит аккаунты с признаками российского владельца — даже если они открыты через VPN. Использование GPT-Image-2 «в лоб» через openai.com сегодня невозможно.

Три рабочих способа использовать GPT-Image-2 в РФ

Команда PhotoPanda проверила каждый вариант на 2026-05-28. Выбирайте по удобству и бюджету.

  1. 1

    Через PhotoPanda (рекомендуем)

    Модель встроена в каталог инструментов под именем gpt-image-2 по цене 7 ₽ за фото medium. Доступ из российского домена, оплата ЮKassa, СБП, картой МИР. Без VPN, чек для юрлица автоматически.

  2. 2

    Через посредников (Bothub, ProxyAPI, vsegpt)

    Покупаете токены за рубли, получаете прокси-доступ к OpenAI API. Наценка 30–50% от прямой цены OpenAI, оплата картой МИР. Подходит для разработчиков с собственной интеграцией.

  3. 3

    Прямо через OpenAI + VPN + иностранная карта

    Регистрация через зарубежный номер, стабильный VPN на Сингапур/Германию/США, иностранная карта (Казахстан, Грузия, Армения). Высокий риск блокировки аккаунта с потерей баланса.

Через PhotoPanda vs прямой OpenAI API

Плюсы
  • Без VPN и зарубежных карт
    Оплата ЮKassa: банковский перевод, СБП, карты МИР, ЮMoney, СберPay. Доступ из любого региона РФ с photopanda.ru.
  • Фиксированная цена в рублях
    7 ₽ за фото medium-качества — без скачков курса доллара и без отдельного биллинга OpenAI. Списание в копейках с балансового счёта.
  • Чеки и закрывающие документы
    Лицензированный российский платёжный агент. ИП Кострюков выставляет чеки для бухгалтерии — подходит для юрлиц и самозанятых.
Минусы
  • Только medium-качество по дефолту
    Для high-уровня нужно явно запросить — цена будет выше. Low не подключён, потому что разница в качестве слишком велика для рабочей выдачи.
  • Нет прямого SDK OpenAI
    Если интеграция требует именно openai-python или openai-node SDK — берите посредников Bothub/ProxyAPI с эмуляцией OpenAI API.

Готовы попробовать GPT-Image-2 без VPN

Регистрация на photopanda.ru/app/register занимает 30 секунд — по email или Telegram, без карты. На баланс зачисляется 25 ₽ приветственного бонуса — хватает на 3–4 генерации medium. Цена фиксирована в рублях, чеки для юрлица выдаются автоматически.

PhotoPanda работает из РФ без VPN, оплата в рублях через ЮKassa. Если GPT-Image-2 не подключена напрямую — у нас есть аналоги в каталоге.

Каталог моделей

Частые вопросы про GPT-Image-2

Ответы на популярные вопросы по цене, доступу из России, лицензии, возможностям и сравнению с конкурентами.

Сколько стоит GPT-Image-2 при прямой работе через OpenAI API?

Цена зависит от уровня качества и разрешения. За изображение 1024×1024 OpenAI берёт примерно:

Уровень Цена за фото Время генерации
Low ~$0,02 8–15 сек
Medium ~$0,07 15–25 сек
High до $0,25 25–40 сек

Прямоугольные форматы 1024×1536 и 1536×1024 стоят пропорционально дороже из-за большего числа токенов (+30–50%). Бесплатного тарифа у OpenAI на эту модель нет — только pay-as-you-go.

При оплате через российских посредников (Bothub, vsegpt, ProxyAPI) добавляется наценка 30–50% к долларовой цене. В пересчёте на рубли по курсу ~95 ₽/$ — это 4–6 ₽ за low, 9–13 ₽ за medium, 30–40 ₽ за high.

Доступна ли GPT-Image-2 в России и можно ли оплатить?

Прямой доступ к OpenAI API из России закрыт с 2024 года. Компания блокирует регистрацию аккаунтов с российских IP, не принимает карты МИР, российские номера телефонов и реквизиты юрлиц. Даже регистрация через VPN с иностранной картой несёт риск блокировки аккаунта с потерей баланса.

Рабочие варианты для РФ:

  1. Через посредников (Bothub, vsegpt, ProxyAPI, Cloud.ru) — покупаете токены за рубли, получаете прокси-доступ к OpenAI API. Наценка 30–50%, оплата картой МИР, ЮKassa, СБП. Подходит для разработчиков с собственной интеграцией под OpenAI SDK.

  2. Через сервисы-обёртки (PhotoPanda, AIPanda) — модель встроена в каталог инструментов с фиксированной ценой в рублях. Без отдельного биллинга OpenAI и без необходимости держать карту иностранного банка.

  3. VPN + иностранная карта — самый рискованный путь. OpenAI периодически банит такие аккаунты после нескольких месяцев работы. Не рекомендуем для production.

Есть ли GPT-Image-2 бесплатно онлайн?

Прямого бесплатного доступа к GPT-Image-2 через OpenAI не существует — модель доступна только pay-as-you-go от $0,02 за фото. ChatGPT Plus и Pro включают image generation, но с лимитами по количеству генераций в день и через интерфейс чата, а не API.

Где можно попробовать бесплатно:

  1. ChatGPT Plus ($20/мес) — лимит ~50 генераций GPT-Image-2 в день через чат. Нужна иностранная карта.

  2. Приветственный бонус 25 ₽ в PhotoPanda — после регистрации зачисляется на баланс, хватает на 3–4 генерации medium-качества для теста.

  3. Бесплатные пробники у посредников — у Bothub и vsegpt бывают разовые промокоды на 50–100 ₽ для новых пользователей.

«Бесплатные сайты» в выдаче с заголовком «gpt image 2 бесплатно онлайн» — обычно либо обёртки с лимитом 1–2 генерации в день, либо подмена на DALL-E 3 / SDXL. Чистого бесплатного GPT-Image-2 в продакшен-объёме нет.

Чем GPT-Image-2 отличается от Nano Banana Pro и какой выбрать?

Это две модели разных школ — у каждой свой характер. На Image Arena Elo GPT-Image-2 занимает первое место (437), на LMArena Image Edit Nano Banana Pro — первое место среди других моделей.

Где GPT-Image-2 сильнее:

  • Inpaint по маске с alpha-каналом — точечная замена области без потери остального
  • Длинные многошаговые промпты — наследует понимание GPT-4o
  • Точный текст на латинице и кириллице в коротких фразах
  • Три уровня качества под разные бюджеты

Где Nano Banana Pro сильнее:

  • Разрешение 4K (3840×2160) против 2048×2048 у high у GPT
  • До 14 reference-фото против 4 у GPT — для multi-image композиций
  • Реалистичные портреты с естественной кожей и руками

Вывод: для рекламы с текстом и inpaint — GPT-Image-2. Для 4K портретов и виртуальной примерки — Nano Banana Pro. Идеально иметь обе — кейсы дополняют друг друга.

Чем GPT-Image-2 отличается от Midjourney v7?

GPT-Image-2 — для точного следования промпту и технических задач. Midjourney v7 — для художественной эстетики и арт-стилей.

Где GPT-Image-2 сильнее:

  1. Текст в кадре — Midjourney до сих пор путает буквы и галлюцинирует надписи
  2. Inpaint по маске — у MJ есть только Vary Region, без alpha-канала
  3. Понимание сложных промптов — GPT-4o под капотом, MJ переписывает и упрощает
  4. Цена за фото — $0,07 medium против $0,02/час кредитов MJ (часовой биллинг)
  5. Доступ из РФ — через российских посредников проще, чем VPN-only Midjourney

Где Midjourney v7 сильнее:

  1. Художественные стили — живопись, графика, концепт-арт, фирменный MJ-look
  2. Композиционная грамотность — модель «понимает» правила третей, свет, баланс
  3. Скорость в Fast-режиме — 30 сек за фото

Вывод: для e-commerce, маркетинговых креативов с надписями, ретуши по маске — GPT-Image-2. Для иллюстраций, постеров с арт-эстетикой, концепт-арта — Midjourney v7.

Поддерживает ли GPT-Image-2 кириллический текст на изображении?

Поддерживает, но с ограничениями. Латинский текст рендерится почти всегда корректно — модель уверенно пишет короткие фразы из 1–8 слов латиницей, включая корпоративные слоганы и продуктовые названия.

Кириллица работает хуже:

  • Хорошо: отдельные короткие слова (до 3–5 букв) — «SALE», «АКЦИЯ», «-50%», бренд-надписи
  • Удовлетворительно: фразы 1–3 слов — «Скидки до 50%», «Открытие магазина»
  • Плохо: длинные фразы (>5–7 слов) — допускает опечатки, путает похожие буквы (ц/п, в/в), иногда «галлюцинирует» псевдо-кириллические символы

Рабочая стратегия:

  1. Короткий русский заголовок + латинский слоган работает идеально: «Скидки» + «UP TO 50%»
  2. Длинные русские фразы — генерируйте сцену без текста и накладывайте надпись шаблоном в Figma или Canva
  3. Гибридный промпт — основа на русском, технические уточнения на английском («постер в стиле swiss design, vector illustration»)
Можно ли через GPT-Image-2 редактировать фото по маске (inpaint)?

Да, это одна из сильнейших возможностей модели. Inpaint с alpha-каналом — главное техническое преимущество над Midjourney и Nano Banana Pro.

Как работает:

  1. На вход подаются три картинки: исходник, маска (чёрно-белое изображение, где белые зоны = что менять) и промпт с описанием замены
  2. Нейросеть переписывает только зоны маски, не трогая остальной кадр
  3. Маска поддерживает alpha-канал и плавные градиенты — переходы между новым контентом и старым выходят без резких границ

Классические задачи:

  • Убрать прыщ или артефакт с лица
  • Заменить цвет одежды на модели
  • Подменить логотип на коробке
  • Дорисовать недостающий объект в сцене
  • Удалить лишний предмет из кадра

В PhotoPanda inpaint доступен в инструменте «Редактирование фото ИИ» — рисуете маску прямо в кабинете кистью, пишете промпт, получаете результат за 15–40 секунд.

Как использовать GPT-Image-2 без VPN из России?

Самый стабильный способ — через PhotoPanda. Сервис работает с российского домена photopanda.ru, без VPN, без блокировок Роскомнадзора и принимает оплату рублями.

Пошагово:

  1. Регистрация на photopanda.ru/app/register — без карты, по email или Telegram. Сразу получаете 25 ₽ приветственного бонуса.

  2. Откройте инструмент «Редактирование фото ИИ» — модель подключена под именем gpt-image-2.

  3. Загрузите исходник или введите текстовый промпт, выберите уровень качества (medium по умолчанию) и нажмите «Сгенерировать».

  4. Результат вернётся через 15–40 секунд, файл скачивается прямо из кабинета.

Для команд есть API: получаете ключ pp_xxx, вызываете эндпоинт /api/v1/image/edit с base64 или ссылкой на исходник, получаете URL результата. Лимит на base64 — 10 МБ. Никаких аккаунтов на OpenAI, иностранных карт и VPN не нужно.

Можно ли продавать изображения от GPT-Image-2 в коммерческих целях?

Да, OpenAI разрешает коммерческое использование сгенерированных и отредактированных изображений в Terms of Use. Вы владеете правами на результаты, можете использовать их в рекламе, на сайтах, в книгах, печатать и перепродавать.

Что запрещено:

  1. Реальные узнаваемые люди без их согласия — известные актёры, политики, ваши клиенты без подписанного согласия
  2. Дипфейки — генерация неотличимых от реальности образов конкретных людей
  3. Дискриминационный контент, медицинские диагнозы, реалистичное насилие, NSFW
  4. Защищённые товарные знаки без лицензии правообладателя

Юридическая защита:

  • Сохраняйте промпт и параметры генерации — это доказательство авторства при разбирательствах
  • При работе через PhotoPanda дополнительные права не требуются — мы оператор передачи запроса, авторские права возникают у заказчика
  • Для печати в типографии и крупного тиража желательно вести лог всех генераций

Для бизнес-кейсов под РФ-юрисдикцию советуем использовать PhotoPanda как контрагента — договор оферты и закрывающие документы для бухгалтерии выдаются автоматически.

Можно ли скачать GPT-Image-2 и запустить локально?

Нет, GPT-Image-2 — закрытая коммерческая модель OpenAI. Веса не публикуются, локальный запуск на своём GPU невозможен. Доступ только через OpenAI API или интеграторов (PhotoPanda, ChatGPT, Bothub).

Если on-premise критичен (приватные данные, отсутствие интернета, лицензирование) — смотрите open-source альтернативы:

  • Flux 1.1 Dev — веса в открытом доступе, запускается на RTX 4090 (24 GB VRAM). Качество близкое к коммерческим моделям
  • Stable Diffusion XL Turbo — open-source, работает даже на RTX 3060 (12 GB). Слабее в типографике, но достаточно для большинства задач
  • HiDream-I1 — недавняя open-source модель с качеством на уровне Flux

Inpaint по маске в open-source реализуют через SDXL + ControlNet Inpaint или Flux Fill — это требует ComfyUI или собственного пайплайна, но даёт сопоставимый результат.

«Скачать GPT-Image-2 бесплатно» в выдаче поисковиков — это фишинг или вирусы. Реальной локальной версии не существует.

Какие промпты на русском работают лучше всего в GPT-Image-2?

GPT-Image-2 понимает русские промпты, но качество результата выше при английских инструкциях — это связано с обучающим датасетом OpenAI.

Рабочая структура (Subject + Style + Technical + Constraints):

[Subject]: молодая женщина с длинными волосами, портрет крупный план
[Style]: glamour photography, magazine cover, professional lighting
[Technical]: shot on Hasselblad H6D-100c, 80mm lens f/2.8, golden hour
[Constraints]: output 2048×2730, 4:5, focus on eyes, no text

Топ-5 приёмов:

  1. Гибрид рус+eng — основа на русском («постер для кофейни»), технические термины на английском («Kodak Portra 400, golden hour, bokeh»)
  2. Кавычки для текста — «на упаковке надпись “Натуральный йогурт”»
  3. Указывайте формат явно — «output 1024×1536, 2:3», иначе получите квадрат 1:1
  4. Позитивные формулировки — «гладко выбритое лицо» лучше, чем «без бороды»
  5. Просите вариации явно — «вариант A: вид сверху, B: вид сбоку»

В PhotoPanda есть встроенный промпт-помощник: пишете на русском, AI переводит и улучшает промпт перед отправкой в модель.

Можно ли использовать GPT-Image-2 через API для интеграции в свой продукт?

Через прямой OpenAI API из России — нет (заблокирован). Через PhotoPanda API — да, это и есть главный сценарий для команд.

Шаги интеграции:

  1. Регистрация в личном кабинете photopanda.ru/app
  2. Получаете ключ формата pp_xxxxxxxxxxxxxxxxxxxxxxxx
  3. Вызываете эндпоинт POST /api/v1/image/edit или /generate с заголовком Authorization: Bearer pp_xxx

Параметры запроса:

  • prompt (string) — текст промпта
  • input_url или input_base64 — для редактирования (base64 до 10 МБ)
  • quality — low / medium / high
  • size — 1024x1024 / 1024x1536 / 1536x1024
  • mask_url или mask_base64 — для inpaint

Ответ — JSON с URL результата, временем генерации и списанной стоимостью.

Асинхронный режим: укажите webhook_url, PhotoPanda дёрнет его HMAC-подписью когда фото готово. Лимит запросов — 60 RPM по умолчанию, повышается по запросу.