DALL-E 3
Нейросеть OpenAI для генерации изображений по тексту, третье поколение модели DALL-E. Публично запущена в октябре 2023 года. Сильная сторона — точное следование сложным промптам и качественный рендеринг текста внутри картинки.
Определение DALL-E 3
DALL-E 3 — модель text-to-image от OpenAI, преемник DALL-E (январь 2021) и DALL-E 2 (апрель 2022). Анонсирована в сентябре 2023, публично запущена 19 октября 2023. Технически — диффузионная модель latent-типа с принципиально другим подходом к UX: встроенная GPT-модель переписывает запрос пользователя в детальный промпт нужного формата.
Архитектура и веса закрыты, но из research-blog OpenAI известно: DALL-E 3 обучалась на синтетических детальных капшенах — собственные модели OpenAI пересказывали изображения в длинные описания, на которых тренировался encoder. Это объясняет ключевое отличие от Midjourney и SD — DALL-E 3 точнее следует логике запроса: «красная кружка слева от синей книги на дубовом столе» получится именно так.
Доступ и тарифы
- ChatGPT Plus / Pro / Team ($20/$200/$30 в мес) — генерация в чате. GPT-4 переписывает промпт, DALL-E 3 генерит. На Plus до 50 генераций / 3 часа.
- OpenAI API — endpoint
images/generations, цены 2026: $0.040 за 1024×1024 standard, $0.080 за 1024×1024 HD, $0.120 за 1792×1024 HD. Без рерайта промпта (параметрыquality,style: natural/vivid). - Microsoft Designer / Bing Image Creator — бесплатно через учётку Microsoft, с лимитом «бустов» в день. Та же модель, иногда с задержкой апдейтов.
Сильные стороны: тексты внутри картинки (вывески, надписи), точное позиционирование объектов, понимание стилевых референсов, длинные промпты (до 4000 символов в API). Слабые: фотореализм лиц уступает Midjourney v7, «перегревает» цвет в vivid, жёсткая модерация NSFW и брендов.
Связанные концепции
DALL-E 3 — представитель диффузионных моделей вместе со Stable Diffusion и Midjourney. Прямой конкурент по точности промпта — GPT-Image-2, заменивший DALL-E 3 в премиальных тарифах ChatGPT в 2026. Качество зависит от prompt engineering: в DALL-E 3 подход обратный — пишите естественно и подробно, модель сама построит технический промпт. Для редактирования готовых фото удобнее nano-banana через prompt-edit в Panda AI.
Частые вопросы
Работает ли DALL-E 3 в России?
Прямой доступ к ChatGPT и OpenAI API из РФ заблокирован — нужен VPN с американским/европейским IP и зарубежная карта. Альтернативы: посредники Bothub, ProxyAPI, GPT-Hub — принимают рубли и проксируют API. Bing Image Creator работает через учётку Microsoft с VPN, бесплатно с лимитом.
Чем DALL-E 3 отличается от Midjourney v7?
DALL-E 3 сильнее в точности следования промпту и в тексте на изображении — лучший выбор для рекламы, постеров, схем с подписями. Midjourney v7 эстетически живее, фотореалистичнее в портретах и fashion. MJ «художественнее», DALL-E 3 «информативнее».
Можно ли коммерчески использовать DALL-E 3?
Да, по ToS OpenAI пользователь получает полные права на результаты — может использовать коммерчески, продавать, печатать на товарах. Это касается и платных тарифов, и бесплатного Bing. Исключение — известные персонажи и бренды, что блокируется модерацией.
Почему DALL-E 3 переписывает мой промпт?
В ChatGPT GPT-4 перед отправкой обрабатывает промпт: добавляет детали, нормализует стиль. Это часть дизайна сервиса. Чтобы получить буквальный промпт, используйте API напрямую или просите ChatGPT: «используй промпт точно как я написал, без изменений».