Real-ESRGAN

Real-ESRGAN — GAN-based нейросеть для апскейла от Tencent (ICCV 2021). Обучена на реалистично деградированных изображениях, BSD-лицензия, малый размер (67 МБ). Самый популярный open-source апскейлер.

Real-ESRGAN (Real-world Enhanced Super-Resolution GAN) — модель апскейла изображений от Tencent ARC Lab, опубликованная в 2021 году (Wang et al., ICCV 2021 Workshops). Развитие классической ESRGAN с фокусом на реальных, деградированных изображениях, а не «чистых» лабораторных данных. На 2026 год — самый популярный open-source апскейлер для общего применения.

В чём отличие от ESRGAN

Оригинальный ESRGAN (2018) обучался на парах изображений, где низкое разрешение получалось через bicubic downsampling. На практике реальные фото содержат куда больше деградаций: JPEG-артефакты, motion blur, noise камеры, цветовые искажения. ESRGAN на таких данных давал плохой результат.

Real-ESRGAN решает эту проблему через модель деградации второго порядка: пары (LR, HR) для обучения генерируются через последовательную цепочку из blur + downsampling + noise + JPEG-сжатия + повтор. Это даёт модель, устойчивую к real-world фото.

Архитектура Real-ESRGAN

  • Generator (RRDB-Net): 23 Residual-in-Residual Dense Blocks, ~16M параметров
  • Discriminator (U-Net): U-Net дискриминатор для пиксельной точности обратной связи
  • Loss: комбинация L1 + perceptual (VGG) + GAN-loss
  • Размер модели: ~67 МБ для x4 версии

Варианты моделей

  • RealESRGAN_x4plus: универсальная для фото, x4 апскейл
  • RealESRGAN_x4plus_anime_6B: специально для аниме и иллюстраций
  • RealESRGAN_x2plus: x2 апскейл, лучше для несильного увеличения
  • RealESR-general-x4v3: новая улучшенная версия 2023

Real-ESRGAN vs SeedVR2 vs Topaz

  • Real-ESRGAN: бесплатно, малая модель (67 МБ), быстро на любой GPU. F-LPIPS ~0.18. Артефакты на лицах, замыленность сложных текстур.
  • SeedVR2: 3B параметров, диффузия, F-LPIPS 0.09. Лучшее качество, требует мощную GPU.
  • Topaz Gigapixel: проприетарный, F-LPIPS 0.11, $199 лицензия, только Windows/Mac.

Сильные стороны Real-ESRGAN

  • Открытый код, свободная лицензия BSD-3-Clause
  • Малый размер — можно запускать на встроенных Intel iGPU, Apple Neural Engine
  • Быстрый — 100-200 мс на фото 1024×1024
  • Не требует prompt'а — полностью автоматический
  • Огромное community — модели для всех типов изображений (фото, аниме, текст)

Слабые стороны

  • Артефакты на лицах — рекомендуется комбинация с GFPGAN или CodeFormer для портретов
  • «Маслянистость» текстур — характерный GAN-артефакт
  • Может «дорисовывать» несуществующие узоры на тканях
  • Уступает диффузионным апскейлерам в качестве на сложных сценах

Применение в Panda AI

Real-ESRGAN доступен как fast-tier в Panda AI для пакетной обработки: model=real-esrgan в API. Цена: 20 коп./фото. Используется когда скорость важнее качества (например, обработка 10 000 миниатюр для каталога). Для критичных задач используйте SeedVR2 апскейл.

FAQ — Real-ESRGAN

Real-ESRGAN бесплатен?

Да, BSD 3-clause лицензия, свободное коммерческое использование. Код и веса опубликованы Tencent на GitHub.

Real-ESRGAN vs SeedVR2?

SeedVR2 — лучшее качество, больше требования к GPU и времени. Real-ESRGAN — компромисс: на 90% качества SeedVR2 при 5x скорости и работе на слабых GPU.

Хорошо ли работает Real-ESRGAN на старых фото?

Средне. Для старых семейных фото лучше комбинированный pipeline: PMRF на лицах + Real-ESRGAN на остальном. В Panda AI это включено как опция face_enhance=true в апскейле.

25 ₽ welcome бонус

Создайте фото с ИИ
за 30 секунд

AI-фотосессия по шаблону, генерация изображений нейросетью или обработка вашего фото — удаление фона, апскейл до 1440p, восстановление лиц. 10 ₽/день бесплатно без регистрации, +25 ₽ welcome бонусом — хватит на 125 удалений фона. Без карты, без подписки, без watermark.