Real-ESRGAN
Real-ESRGAN — GAN-based нейросеть для апскейла от Tencent (ICCV 2021). Обучена на реалистично деградированных изображениях, BSD-лицензия, малый размер (67 МБ). Самый популярный open-source апскейлер.
Real-ESRGAN (Real-world Enhanced Super-Resolution GAN) — модель апскейла изображений от Tencent ARC Lab, опубликованная в 2021 году (Wang et al., ICCV 2021 Workshops). Развитие классической ESRGAN с фокусом на реальных, деградированных изображениях, а не «чистых» лабораторных данных. На 2026 год — самый популярный open-source апскейлер для общего применения.
В чём отличие от ESRGAN
Оригинальный ESRGAN (2018) обучался на парах изображений, где низкое разрешение получалось через bicubic downsampling. На практике реальные фото содержат куда больше деградаций: JPEG-артефакты, motion blur, noise камеры, цветовые искажения. ESRGAN на таких данных давал плохой результат.
Real-ESRGAN решает эту проблему через модель деградации второго порядка: пары (LR, HR) для обучения генерируются через последовательную цепочку из blur + downsampling + noise + JPEG-сжатия + повтор. Это даёт модель, устойчивую к real-world фото.
Архитектура Real-ESRGAN
- Generator (RRDB-Net): 23 Residual-in-Residual Dense Blocks, ~16M параметров
- Discriminator (U-Net): U-Net дискриминатор для пиксельной точности обратной связи
- Loss: комбинация L1 + perceptual (VGG) + GAN-loss
- Размер модели: ~67 МБ для x4 версии
Варианты моделей
- RealESRGAN_x4plus: универсальная для фото, x4 апскейл
- RealESRGAN_x4plus_anime_6B: специально для аниме и иллюстраций
- RealESRGAN_x2plus: x2 апскейл, лучше для несильного увеличения
- RealESR-general-x4v3: новая улучшенная версия 2023
Real-ESRGAN vs SeedVR2 vs Topaz
- Real-ESRGAN: бесплатно, малая модель (67 МБ), быстро на любой GPU. F-LPIPS ~0.18. Артефакты на лицах, замыленность сложных текстур.
- SeedVR2: 3B параметров, диффузия, F-LPIPS 0.09. Лучшее качество, требует мощную GPU.
- Topaz Gigapixel: проприетарный, F-LPIPS 0.11, $199 лицензия, только Windows/Mac.
Сильные стороны Real-ESRGAN
- Открытый код, свободная лицензия BSD-3-Clause
- Малый размер — можно запускать на встроенных Intel iGPU, Apple Neural Engine
- Быстрый — 100-200 мс на фото 1024×1024
- Не требует prompt'а — полностью автоматический
- Огромное community — модели для всех типов изображений (фото, аниме, текст)
Слабые стороны
- Артефакты на лицах — рекомендуется комбинация с GFPGAN или CodeFormer для портретов
- «Маслянистость» текстур — характерный GAN-артефакт
- Может «дорисовывать» несуществующие узоры на тканях
- Уступает диффузионным апскейлерам в качестве на сложных сценах
Применение в Panda AI
Real-ESRGAN доступен как fast-tier в Panda AI для пакетной обработки: model=real-esrgan в API. Цена: 20 коп./фото. Используется когда скорость важнее качества (например, обработка 10 000 миниатюр для каталога). Для критичных задач используйте SeedVR2 апскейл.
FAQ — Real-ESRGAN
Real-ESRGAN бесплатен?
Да, BSD 3-clause лицензия, свободное коммерческое использование. Код и веса опубликованы Tencent на GitHub.
Real-ESRGAN vs SeedVR2?
SeedVR2 — лучшее качество, больше требования к GPU и времени. Real-ESRGAN — компромисс: на 90% качества SeedVR2 при 5x скорости и работе на слабых GPU.
Хорошо ли работает Real-ESRGAN на старых фото?
Средне. Для старых семейных фото лучше комбинированный pipeline: PMRF на лицах + Real-ESRGAN на остальном. В Panda AI это включено как опция face_enhance=true в апскейле.