Panda AI · печатный 2 ₽ · рукопись 5 ₽ / страница

OCR онлайн: распознать текст с фото —
Markdown с таблицами или рукопись

Загрузите JPG, PNG, WebP или многостраничный PDF до 25 МБ — Panda AI распознает текст. Печатный — Markdown с заголовками, таблицами и формулами. Рукопись — текст с разбивкой по строкам. До 10 ₽/день бесплатно, без регистрации. Часть экосистемы Panda AI: AI-фотосессии, генерация и обработка фото нейросетью.

Пример распознавания текста с фото нейросетью Panda AI

Попробуйте распознать текст прямо сейчас

Выберите тип текста, загрузите фото — получите готовый результат за секунды. До 10 ₽/день бесплатно. Регистрация — +25 ₽ бонус.

Загружаем лимит...
Фото, скан, PDF или текстовый документ

Перетащите фото сюда

или нажмите для выбора · JPG, PNG, WebP · до 25 МБ

JPG / PNG / WebP, PDF, DOC/DOCX/RTF/ODT/HTML/TXT до 25 МБ. Многостраничный PDF — оплата за каждую страницу.

Загрузите файл — результат появится здесь

Стоимость: 2 ₽ · в пределах дневного бесплатного лимита 10 ₽

Два движка под две разные задачи

Печатный текст — на нашем GPU быстро и дёшево. Рукопись — multimodal Vision-нейросеть.

2–7 секунд на страницу

Печатный текст со скана, фото или PDF — на нашей RTX 3090, 2–7 секунд на страницу. Рукопись — 10–20 секунд на страницу.

Markdown с форматированием

На выходе не сплошной текст, а Markdown с заголовками, абзацами, списками, таблицами в формате `| col |` и формулами LaTeX. Готово к импорту в Notion, Obsidian, Word.

PDF без разбивки на страницы

Загружаете многостраничный PDF — мы разбираем его постранично и возвращаем один связный Markdown. Оплата за каждую распознанную страницу.

Рукописный текст

Разбираем курсив, нестандартный наклон, рукописные пометки на полях, советские документы, личные дневники, школьные тетради.

Автоопределение языка

Поддерживаем 90+ языков с автоопределением. Не нужно выбирать — загружайте русский, английский, любой смешанный текст.

API + пакетная обработка

REST API с webhook callback для интеграции в свой пайплайн. Пакетный режим до 50 файлов в один запрос — полезно для оцифровки архивов.

Без подписок и watermark

Плата по факту распознавания. До 10 ₽/день бесплатно без регистрации, 25 ₽ welcome-бонус при регистрации (≈5 страниц).

Как работает распознавание текста нейросетью

Современные системы распознавания давно ушли от старого подхода с шаблонным сравнением символов. Сегодня OCR — это многоступенчатая задача глубокого обучения: нейросеть находит области с текстом, распознаёт буквы и слова, реконструирует структуру страницы и переводит формулы в LaTeX. Старые системы выдавали сплошную строку — современные возвращают готовый размеченный документ.

Печатный текст — на нашем GPU

Для печатного текста работает движок на нашей RTX 3090 в РФ. Он делает три вещи сразу: детектит буквы (90+ языков с автоопределением), размечает страницу на блоки (заголовок, абзац, список, таблица, формула), переводит математику в LaTeX. Страница обрабатывается за 2–7 секунд. Принимает картинки и многостраничный PDF целиком — на выходе готовый Markdown с заголовками, таблицами вида | col1 | col2 |, формулами в $\\LaTeX$ и ссылками на встроенные изображения.

Рукописный текст — multimodal Vision

Для рукописи обычные OCR-движки работают плохо: каждый человек пишет своим почерком, буквы соединяются курсивом, наклон отличается. Поэтому для рукописи мы используем multimodal-модель Vision-класса — она понимает индивидуальные особенности почерка, читает по контексту, справляется с пометками на полях и зачёркнутыми фрагментами. 15-секундный API-вызов гораздо быстрее ручной расшифровки.

Что хорошо распознаём

  • Сканы документов — паспорта, договоры, акты, квитанции. Точность 98%+ на чистых сканах с 300 DPI.
  • Скриншоты сайтов и приложений — экранный текст в идеальном качестве, любой шрифт читается без ошибок.
  • Фото книжных страниц — типографский шрифт, включая советские издания и сложные таблицы (сохраняем структуру таблиц в Markdown).
  • Многостраничные PDF — разбираем все страницы и склеиваем в один Markdown-документ.
  • Документы DOCX/DOC/RTF/ODT/HTML/TXT — без OCR, прямая конвертация в Markdown.
  • Рукописные заметки — школьные тетради, конспекты лекций, личные дневники, рецепты.

Где могут быть ошибки

100% точности не бывает. Печатный режим может ошибиться на очень мелком тексте (ниже 8pt в фотопикселях), сильном расфокусе, нестандартных декоративных шрифтах. Рукописный — на очень небрежном курсиве, перечёркнутых фрагментах, выцветших чернилах. В таких случаях помогает предварительный апскейл нейросетью: увеличиваем разрешение и резкость, потом распознаём уже на чётком исходнике.

Кому пригодится распознавание текста онлайн

Студентам и школьникам

Сфотографировал страницу учебника или конспект — получил текст, можно искать ключевые слова, копировать в реферат, переводить через DeepL. Распознавание рукописи помогает оцифровать собственные конспекты лекций для поиска по ним позже. 25 ₽ welcome бонуса хватит на 5 страниц — обычно достаточно чтобы оцифровать материал к экзамену.

Бухгалтерам и юристам

Сканы документов — счета, акты, договоры, протоколы. После распознавания текст легко скопировать в учётную программу, отправить контрагенту, заархивировать с поиском по содержимому. Через API можно автоматизировать обработку: настройте отправку отсканированных документов на наш endpoint, получайте JSON с текстом и метаданными в свою CRM/ERP.

Историкам и архивистам

Семейные архивы, военные письма, дневники прадедов, школьные тетради 50-х годов. Рукописный режим справляется с большинством разборчивых документов XX века. Пакетный режим до 50 файлов позволяет оцифровать целые альбомы за один заход. Стоимость 5 ₽/лист — гораздо дешевле услуг архивиста.

Журналистам и исследователям

Фотография инфографики на конференции, цитата из старой газеты, скан архивного документа. Распознать, скопировать, использовать в статье. Сохранение структуры по строкам и абзацам — важно при цитировании.

Маркетплейс-продавцам

Конкурентная разведка: фотография ценника в офлайн-магазине, фото описания товара у конкурента — получаете текст для своего предложения. Распознавание этикеток для каталога — отправляйте партии через API, получайте структурированные данные.

Разработчикам

REST API с OpenAPI 3.1 документацией, асинхронный режим с webhook callback. Интегрируйте в свой пайплайн обработки документов, индексирования сканов, поиска по фото. JSON-ответ содержит координаты строк (bbox) — можно реконструировать структуру таблиц и форм.

Частые вопросы про распознавание текста

Что такое OCR и чем он отличается от распознавания рукописи?

OCR (Optical Character Recognition) — оптическое распознавание печатного текста: сканов документов, скриншотов, фото книжных страниц. У нас современный движок на GPU, который не просто выдёргивает символы, а реконструирует структуру: заголовки, абзацы, списки, таблицы, формулы. На выходе — готовый Markdown. Распознавание рукописи — отдельная задача: курсив, индивидуальный наклон, прописные буквы соединены, требуется multimodal-модель Vision-класса. Цены: печатный 2 ₽/страница, рукописный 5 ₽/страница.

Сколько стоит распознать текст с фото?

В Panda AI — 2 ₽ за страницу печатного текста и 5 ₽ за страницу рукописи. Это в десятки раз дешевле зарубежных сервисов вроде ABBYY FineReader Online (от 100 ₽/страница) и Adobe Scan (подписка от 600 ₽/мес). Платите только за успешные распознавания — если нейросеть не смогла прочитать, баланс возвращается автоматически.

Бесплатно ли распознавание текста онлайн?

Да. Без регистрации — до 10 ₽/день на IP, это 2 страницы любого типа. При регистрации дарим 25 ₽ welcome-бонус — это 5 страниц. Никакой карты при регистрации не нужно, она потребуется только когда захотите пополнить баланс сверх бонуса.

На каких языках работает OCR?

Поддерживаем 90+ языков с автоопределением. Не нужно выбирать язык вручную: загружайте русский, английский, китайский, арабский, смешанные документы. Распознавание рукописи — тоже автоматический выбор языка, основные европейские и азиатские.

Какое максимальное разрешение фото поддерживается?

Файлы JPG, PNG, WebP или PDF до 25 МБ. По разрешению — без ограничений. Для печатного оптимально 300 DPI на сканах документов (стандарт качества), но мы хорошо справляемся и с фото на телефоне в нормальном свете. Для рукописи рекомендуем хорошее освещение и чёткий снимок — низкое разрешение усложняет распознавание любому движку.

Точность распознавания печатного текста?

На чистых сканах документов и обычных шрифтах (Times, Arial, Calibri) — ~98% точности и корректная структура (заголовки/таблицы/формулы). На фото с телефона с нормальным освещением — 95–97%. Сложные случаи (мятая бумага, неравномерное освещение, очень мелкий текст) — 85–95%. Сравнимо с ABBYY FineReader, и в плане структуры (таблицы/Markdown) часто лучше.

Можно ли распознать рукописный текст с фото тетради?

Да. Загружайте фото страницы из тетради с почерком — нейросеть проанализирует и вернёт текст, сохраняя разбивку по строкам и абзацам. Хорошо работает с обычным аккуратным почерком, школьными тетрадями, конспектами лекций. Сложнее: очень небрежный курсив, перечёркнутый текст, мелкий почерк ниже размера обычной строки. Если буква неразборчива — модель пишет её как [?], чтобы вы видели где сомнение.

Распознаёт ли советские документы и старые тексты?

Да, оба инструмента. Печатный режим справляется с типографским шрифтом советских книг и газет, включая таблицы и формулы. Дореформенная орфография (ять, фита, ижица) — частично, лучше тестируйте на конкретном документе. Рукописный — хорошо разбирает документы XX века: военные письма, дневники, школьные отметки, рецепты. Может пропустить отдельные слова в очень выцветшем тексте.

Можно ли загружать многостраничный PDF?

Да. Загружаете PDF целиком — мы сами разбираем его постранично и возвращаем один связный Markdown-документ со всей структурой. Не нужно конвертировать в картинки, не нужно склеивать страницы. Оплата за каждую распознанную страницу (2 ₽). Максимум 50 страниц за один файл.

В каком формате возвращается результат?

Для печатного — Markdown (.md): заголовки, абзацы, таблицы вида `| col1 | col2 |`, формулы LaTeX, ссылки на figures. Готово к импорту в Notion, Obsidian, Word, любой редактор. Для рукописи — plain text (.txt) с разбивкой по строкам. Через API дополнительно возвращается JSON с метаданными (page_count, source, duration_ms).

Есть ли пакетное распознавание архива сканов?

Да. В личном кабинете на вкладке «Пакетно» загружаете до 50 файлов за раз — на выходе ZIP-архив со всеми результатами. Через API (POST /api/v1/photos/batch) ограничений по количеству нет. Цена та же: от 2 ₽ за страницу, без наценок на пакет.

Безопасно ли загружать конфиденциальные документы?

Да. Обработка идёт на наших серверах в РФ (печатный — собственная RTX 3090, рукопись — российский прокси). Документы не передаются третьим лицам, не индексируются и не используются для обучения моделей. Исходники удаляются сразу после распознавания. Результат хранится в личном кабинете 30 дней и затем удаляется автоматически. Передача данных идёт по HTTPS с TLS 1.3.

Есть ли API для интеграции?

Да. REST API с OpenAPI 3.1 документацией: POST /api/v1/photos/process с заголовком X-API-Key, в теле — multipart/form-data с файлом и параметром operation=ocr_markdown (печатный) или ocr_handwritten (рукопись). Sync-режим возвращает JSON прямо в ответе, async — присылает webhook с HMAC-SHA256 подписью. Используйте для автоматизации обработки документооборота, оцифровки архивов, индексации сканов.

Другие инструменты Panda AI

OCR — часть экосистемы Panda AI: создавайте фото с ИИ, обрабатывайте нейросетью и распознавайте текст в одном сервисе.

25 ₽ welcome бонус

Создайте фото с ИИ
за 30 секунд

AI-фотосессия по шаблону, генерация изображений нейросетью или обработка вашего фото — удаление фона, апскейл до 1440p, восстановление лиц. 10 ₽/день бесплатно без регистрации, +25 ₽ welcome бонусом — хватит на 125 удалений фона. Без карты, без подписки, без watermark.