DIS-VD (S-measure)
0.911Структурная метрика на валидационном наборе Dichotomous Image Segmentation для general-чекпоинта SwinL 1024×1024.
Источник: github.com/ZhengPeng7/BiRefNet · 2024-08-15
Open-source SOTA для удаления фона нейросетью. Точно выделяет волосы, мех, прозрачности и тонкие края. Лучше rembg, U2Net и MODNet. MIT-лицензия.
Результаты из известных систем оценки и независимых leaderboard'ов. Цифры берутся из официальных публикаций разработчика и публичных бенчмарков.
Структурная метрика на валидационном наборе Dichotomous Image Segmentation для general-чекпоинта SwinL 1024×1024.
Источник: github.com/ZhengPeng7/BiRefNet · 2024-08-15
Взвешенная F-мера на DIS-TE4 (HR-вариант) — стандартная метрика качества выделения тонких краёв и волос.
Источник: github.com/ZhengPeng7/BiRefNet · 2024-08-15
Weighted F-measure на бенчмарке general matting — тонкое выделение объекта с альфа-каналом без тримапа.
Источник: github.com/ZhengPeng7/BiRefNet · 2024-08-15
Структурная метрика на портретном матировании — устойчивость к волосам, лицам и пограничным пикселям.
Источник: github.com/ZhengPeng7/BiRefNet · 2024-08-15
Время прогона одного кадра 1024×1024 на потребительском GPU в полуточном режиме — продакшен-готово.
Источник: github.com/ZhengPeng7/BiRefNet · 2024-08-15
BiRefNet (Bilateral Reference Network) — открытая нейросеть для задачи Dichotomous Image Segmentation: предельно точного удаления фона с фото с переносом тончайших деталей. Разработана лабораторией ZhengPeng в 2024 году, paper опубликован в CAAI AI Research, веса лежат на GitHub под лицензией MIT.
В отличие от типовых решений вроде rembg, U2Net и MODNet, BiRefNet специально обучен на наборах данных высокого разрешения (DIS5K, HRSOD, UHRSD) и держит первое место в категории High-Resolution Salient Object Detection на Papers with Code. По задаче «удалить фон с фото нейросетью» — это лучший открытый инструмент на 2026 год.
Что важно знать о точности и аппаратных требованиях перед запуском.
Лучший результат среди open-source бэкграунд-ремуверов. У U2Net (rembg) — ~0.65–0.70.
Разрешено любое коммерческое использование с сохранением атрибуции.
Запускается на RTX 3060 12GB. Для HR-варианта 2048×2048 — нужно ~8 ГБ.
Пакет из 1000 фото обрабатывается за ~90 секунд GPU-времени.
Шесть способностей, ради которых разработчики берут BiRefNet вместо rembg или коммерческого remove.bg.
Каждая разлетающаяся прядь, концы кудряшек, мелкая щетина — корректно переносятся в PNG. Главная боль rembg и MODNet закрыта.
Шерсть кошек и собак, перья птиц, меховой воротник — модель аккуратно вырезает с сохранением микроструктуры. Критично для каталогов зоомагазинов.
Бокалы, очки, прозрачные упаковки, ажурное кружево — BiRefNet корректно работает с тримап-фри матированием и полупрозрачными областями.
Ножки очков, дужки сумок, кабели, цепочки украшений, проволочные изделия. Контур не «съедается» и не размывается.
HR-чекпоинт обучен на 2048×2048 пикселей. Поддержка фото до 4K без артефактов и характерных «лесенок» по контуру.
REST API для пакетной обработки — 10 000 фото за 15 минут на RTX 3090. Webhook-уведомление о завершении, ZIP-архивом или поштучно.
Wordstat показывает массовые запросы «birefnet vs rembg» и «лучшая нейросеть для удаления фона» — собрали сравнение в таблицу.
| Параметр | Эта модель | rembg (U2Net) | MODNet | Remove.bg |
|---|---|---|---|---|
| Год / SOTA-статус | 2024, SOTA на DIS | 2020, базовый | 2020, портреты | Закрытый коммерческий |
| weighted F-measure (DIS-TE4) | 0.894 | ~0.65–0.70 | ~0.72 (портреты) | ~0.88 (закрытый) |
| Качество волос и меха | Отлично | Удовлетворительно | Хорошо (портреты) | Отлично |
| Прозрачности и стекло | Поддерживает | Не поддерживает | Слабо | Поддерживает |
| Максимальное разрешение | До 4K (HR-вариант) | ~1024×1024 | ~512×512 | До 25 МП |
| Лицензия | MIT (свободная) | MIT | Apache 2.0 | Закрытая, $0.2/фото |
| Запуск локально | Да, на 6+ ГБ VRAM | Да, CPU OK | Да, CPU OK | Нет, только API |
Если нужна максимальная точность на волосах, мехе и тонких краях с open-source лицензией — BiRefNet. Для простых задач без сложных кромок rembg достаточно и работает на CPU.
Три рабочих способа: онлайн без регистрации, через ComfyUI на своём ПК и через API для интеграции в продакшен.
Через браузер: JPG, PNG, WebP или HEIC, до 50 МБ за файл. Никакой регистрации для пробных фото не нужно.
Модель выберет подходящий чекпоинт (general или HR) автоматически по разрешению исходника. Прогресс отображается в реальном времени.
Включите режим просмотра с прозрачным фоном (шахматная сетка). Особое внимание — концы волос, контуры одежды, мелкие детали.
Готовый файл с альфа-каналом. Подходит для коллажей, карточек маркетплейса, презентаций, дизайн-проектов. Опционально — пакетный ZIP-архив.
Эти приёмы повышают качество альфа-канала на сложных кадрах — забирайте в шпаргалку.
Для разрешений выше 1024×1024 переключайте чекпоинт на BiRefNet_HR — он обучен на 2048×2048 и даёт прирост weighted F-measure на 0.02.
Если планируете заранее — берите однотонный фон (зелёный, синий, белый), контрастный объекту. Модель работает быстрее и точнее.
Жёсткие тени на одежде или волосах модель иногда «съедает» как часть фона. Мягкий рассеянный свет — оптимальное решение.
Для бокалов, очков, прозрачных упаковок используйте чекпоинт BiRefNet-matting — он умеет в полупрозрачные альфа-значения, а не только бинарную маску.
Для пакета 100+ фото быстрее использовать REST API с авторизацией по ключу. Параллелизм до 10 запросов, webhook о завершении.
На сложных кадрах остаются мелкие пиксельные артефакты по контуру. Антиалиасинг + размытие 1px по маске убирают 95% таких случаев.
Реальные сценарии использования модели — от продуктовой съёмки и маркетплейсов до семейных фотосессий и художественных проектов.
Удаление фона у тысяч карточек Wildberries, Ozon и Lamoda с сохранением шерсти, кружева, прозрачностей и металлических деталей. Пакетная обработка по API.
Нейросеть аккуратно вырезает причёску с разлетающимися прядями, не «съедая» концы волос. Подходит для аватаров, ID-фото и презентаций.
Чистый альфа-канал на изделиях с тонкой цепочкой, гранями камней и блестящими полированными поверхностями без чёрной обводки.
Подготовка PNG-исходников для коллажей: ажурные ткани, плетёная мебель, проволочные изделия выделяются с альфа-каналом без ручной правки.
BiRefNet корректно выделяет шерсть и усы животных — критично для каталогов кормов, груминг-салонов и сайтов питомников.
Подложка чистых PNG для макетов в Figma, Photoshop и InDesign. Сокращает рутинную выкрутку фотографий до пары минут на пачку.
Чистая маска одежды для последующего наложения на манекен или модель в Nano Banana, GPT Image и других multi-image-edit моделях.
Единый белый или брендовый фон для всех фото в карточках товаров. Используется для пакетной обработки 1000+ изображений.
| Тариф | Параметры | Цена |
|---|---|---|
| Локально на своём GPU | MIT-лицензия · веса с GitHub / Hugging Face | Бесплатно |
| Облачный GPU (Selectel, Cloud.ru) | RTX 4090 · аренда по часам | от 80 ₽/ час |
| Hugging Face Spaces | Бесплатное демо · с очередями в пиковые часы | Бесплатно |
| ComfyUI с нодой BiRefNet | Установка через ComfyUI Manager | Бесплатно |
| REST API (готовый продакшен) | См. карточку справа · без своего железа | от 0,20 ₽/ фото |
Это open-source проект под лицензией MIT — никаких санкционных ограничений. GitHub-репозиторий и Hugging Face открываются из РФ напрямую, без VPN. Веса можно скачать, развернуть на своём GPU и использовать бесплатно без лимитов. Лицензия прямо разрешает коммерческое применение, в том числе в SaaS и B2B-продуктах.
Выбирайте по инфраструктуре: от прямого запуска на своей видеокарте до готового веб-инструмента с оплатой в рублях.
Скачать веса с GitHub ZhengPeng7/BiRefNet или Hugging Face, поставить PyTorch с CUDA, запустить inference.py. Нужна видеокарта от 6 ГБ VRAM (RTX 3060 12 GB, 4060, 4070). Бесплатно навсегда.
В ComfyUI Manager есть готовая нода BiRefNet — устанавливается в один клик. Подходит для дизайнеров, которые уже работают со Stable Diffusion и Flux. Веса лежат в models/birefnet/.
Selectel, Cloud.ru, Yandex Cloud — аренда RTX 4090 от 80 ₽ в час. Подходит для одноразовых проектов и пакетной обработки без покупки своего железа.
Если нужен готовый веб-инструмент с оплатой в рублях — BiRefNet встроен в инструмент «Удалить фон»: загружаете фото, через 2–5 секунд получаете PNG с прозрачным фоном. Без VPN, без валютных карт, ЮKassa с картами МИР и СБП. Закрывающие документы для ИП и ООО — по запросу. Free tier 5 пробных фото в день с водяным знаком.
PhotoPanda работает из РФ без VPN, оплата в рублях через ЮKassa. Если BiRefNet не подключена напрямую — у нас есть аналоги в каталоге.
Каталог моделейОтветы на популярные вопросы по цене, доступу из России, лицензии, возможностям и сравнению с конкурентами.
Сама модель бесплатна — лицензия MIT разрешает любое использование, в том числе коммерческое. Веса можно скачать с GitHub (ZhengPeng7/BiRefNet) или Hugging Face без регистрации и платежей.
Финансовые расходы возникают только за инфраструктуру:
| Сценарий | Цена | Когда выбирать |
|---|---|---|
| Локально на своём GPU | Бесплатно | Регулярная обработка, есть RTX 3060+ |
| Облачный GPU (Selectel, Cloud.ru) | от 80 ₽/час RTX 4090 | Одноразовые проекты, нет своего железа |
| Hugging Face Spaces | Бесплатно | Тест на 5–10 фото, без срочности |
| Готовый веб-сервис | от 0,20 ₽ за фото | Нужно прямо сейчас, без админа |
На пакете в 10 000 фото себестоимость инференса на собственном RTX 3090 — около 0,05 ₽ за кадр (электричество + амортизация). На облаке — около 0,08 ₽. Готовый сервис включает GPU + постобработку + хранение + API.
Да, полностью доступна. Это open-source проект на GitHub (ZhengPeng7/BiRefNet) и Hugging Face — оба ресурса в РФ открываются напрямую без VPN. Никаких санкционных ограничений на лицензии MIT нет, она прямо разрешает коммерческое использование в любой юрисдикции, включая Россию и Беларусь.
Веса можно скачать, развернуть локально и пользоваться бесплатно — никаких ограничений по объёму или прибыли. Hugging Face иногда ограничивает массовую загрузку крупных файлов из определённых IP-диапазонов — если столкнулись с timeout, поможет кратковременный VPN или прямая ссылка с GitHub Releases.
Для облачной аренды GPU в РФ работают Selectel, Cloud.ru, Yandex Cloud — все принимают рубли, выдают акт и УПД для ИП и ООО. Также есть готовые веб-инструменты с оплатой через ЮKassa в рублях — без валютных карт и регистрации в зарубежных сервисах.
rembg — Python-обёртка вокруг моделей U2Net и её модификаций. Работает быстро на CPU, удобный API, но качество ограничено базовой нейросетью 2020 года.
BiRefNet — самостоятельная архитектура 2024 года: bilateral reference + Swin Transformer Large + два generator-модуля. Обучена на DIS5K, HRSOD, UHRSD, COD10K — наборах высокого разрешения со сложными силуэтами.
Практическая разница:
| Метрика | BiRefNet | rembg (U2Net) |
|---|---|---|
| weighted F-measure на DIS-TE4 | 0.894 | ~0.65–0.70 |
| Качество на волосах | Отлично | Удовлетворительно |
| Прозрачности (стекло) | Поддерживает | Не поддерживает |
| Максимальное разрешение | 2048×2048 | ~1024×1024 |
| Запуск на CPU | Медленно (15 сек) | Быстро (3 сек) |
Если нужна точность на тонких краях и волосах — BiRefNet. Если приоритет скорость на CPU без GPU — rembg.
Локальный запуск занимает 15–20 минут. Пошаговая инструкция:
git clone https://github.com/ZhengPeng7/BiRefNet и установите зависимости из requirements.txt.transformers.AutoModelForImageSegmentation.Минимальные требования:
Для продакшена соберите Docker-образ, оберните в FastAPI или Triton Inference Server, добавьте очередь BullMQ или Celery. Без админ-опыта это 2–3 дня работы.
Да, BiRefNet — полностью бесплатная open-source модель под лицензией MIT. Никаких подписок, лимитов запросов, ограничений по объёму или коммерческому доходу.
Что входит в «бесплатно»:
Единственное обязательство — сохранять упоминание авторства (ZhengPeng7) и ссылку на оригинальный paper «Bilateral Reference for High-Resolution Dichotomous Image Segmentation» (CAAI AIR, 2024) в исходниках продукта.
Расходы возникают только за инфраструктуру: облачный GPU (~80 ₽/час) или электричество для собственной видеокарты. Если своего железа нет — попробуйте Hugging Face Spaces (бесплатное демо) или готовые веб-сервисы (от 0,20 ₽ за фото).
BiRefNet — это модель для изображений, не для текста, поэтому понятие «русский язык» к ней не относится напрямую. Модель работает с пикселями: на вход — RGB-фото, на выход — альфа-маска.
Что работает на русскоязычных проектах:
Если на фото есть русский текст (вывески, упаковка, чеки) — BiRefNet корректно сохраняет его в выделенном объекте без искажений. Это плюс по сравнению с моделями, которые «съедают» мелкие шрифты на границах.
Поддержка в инструментах: ComfyUI имеет русский язык в Manager, Hugging Face Spaces — на английском, российские веб-сервисы — на русском с поддержкой по email и в Telegram.
Да, лицензия MIT прямо разрешает коммерческое использование, перепродажу, модификацию и встраивание в SaaS-продукты без ограничений по объёму, доходу или географии.
Что разрешено:
Единственное обязательство — сохранить упоминание авторства в исходниках. Минимальный вариант: текстовый файл LICENSE в репозитории + упоминание в About-разделе сайта/приложения с ссылкой на оригинальный paper.
Для enterprise-внедрений (банки, госзаказ, медицина) MIT — одна из самых дружественных лицензий: проходит проверку безопасности проще, чем GPL или AGPL. Не нужны юридические согласования с автором, не нужны роялти. Если есть сомнения по конкретному use-case — напишите в Issues репозитория, ZhengPeng7 отзывчив.
На 2026 год BiRefNet — лучший open-source бэкграунд-ремувер по совокупности качества, лицензии и активности развития. Это подтверждается:
Закрытые альтернативы:
Открытые альтернативы:
Для большинства задач BiRefNet закрывает 95% потребностей без необходимости платить за закрытые сервисы.
BiRefNet заметно точнее на сложных случаях с волосами — это его главная сильная сторона. Разница не косметическая, а заметна невооружённым глазом на 80% реальных фото.
Что происходит на волосах в каждой модели:
| Случай | rembg (U2Net) | BiRefNet |
|---|---|---|
| Прямые волосы на простом фоне | Хорошо | Отлично |
| Кудрявые волосы | Концы «съедены» | Каждая прядь сохранена |
| Разлетающиеся пряди | Размытие, ореол | Чёткий альфа-канал |
| Седые/блондинистые волосы | Сливаются со светлым фоном | Корректное выделение |
| Тёмные волосы на тёмном фоне | Артефакты по контуру | Чистый край |
Технические причины:
Что выбрать: rembg подойдёт для простых случаев с прямыми волосами на контрастном фоне. Для портретов с кудрями, причёсками, разлетающимися прядями — однозначно BiRefNet.
Волосы — самая сложная задача в сегментации изображений по нескольким техническим причинам, и большинство нейросетей здесь спотыкаются.
4 причины сложности:
Пиксели на границе не бинарные. Полупрозрачные волосы — это смесь цвета фона и цвета волос. Чисто бинарная маска (0 или 1) неизбежно теряет такие пиксели. Нужна модель с поддержкой матирования и альфа-канала.
Высокая частотность. Каждая прядь волос — это деталь в 1–3 пикселя. Конволюционные слои с большими kernel'ами размывают такие детали в первых же слоях.
Контекстная неоднозначность. Седой волос на белом фоне или чёрный волос на чёрном — модели сложно понять, где граница. Нужно знание глобального контекста сцены.
Разнообразие текстур. Прямые, кудрявые, дреды, тонкие, толстые, мокрые, окрашенные — каждый случай со своими физическими свойствами рассеивания света.
Как BiRefNet решает эти проблемы:
Результат — weighted F-measure 0.894 на DIS-TE4, у U2Net (rembg) только ~0.65–0.70. На реальных кадрах разница видна без увеличения.