PDF OCR X

Бесплатно
Windows
macOS

Сайт: solutions.weblite.ca/pdfocrx

PDF OCR X — настольная утилита для оптического распознавания текста (OCR) в отсканированных PDF-документах и растровых изображениях. Программа предназначена для извлечения текста и создания редактируемых текстовых файлов или поисковых PDF, сохраняя при этом исходную структуру страниц по возможности. Разработка и распространение утилиты осуществлялись с акцентом на простоту использования и базовый набор функций, типичных для небольших офисных и индивидуальных рабочих сценариев.

Приложение представлено в двух вариантах: бесплатная Community-версия с функциональными ограничениями на обработку файлы небольшого объёма (включая ограничения по длине или по количеству страниц за одну операцию) и коммерческая Enterprise-версия без таких ограничений, ориентированная на корпоративных пользователей и массовую обработку документов. Точная история выпуска и подробная информация о вендоре могут быть скудными в общедоступных источниках; ниже приведено описание ожидаемого набора возможностей и типичных характеристик для программ этого класса.

  • Распознавание текста: извлечение печатного текста из растровых изображений и отсканированных страниц PDF с последующим сохранением в текстовые файлы или встраиванием в PDF как текстовый слой.
  • Форматы ввода и вывода: поддержка популярных растровых форматов изображений и PDF; экспорт в редактируемые форматы, включая plain text и поисковые PDF.
  • Языковая поддержка: распознавание множества языков с возможностью выбора языка OCR для повышения точности; наличие встроенной или подключаемой языковой модели.
  • Пакетная обработка: в Enterprise-версии — возможность пакетной обработки большого количества файлов и многопоточная работа для ускорения конвертации.
  • Параметры качества и предобработки: функции улучшения качества изображений — поворот, обрезка, регулировка контраста и удаление шума для повышения точности распознавания.
  • Сохранение исходного оформления: попытки сохранить базовую разметку страницы (колонки, абзацы) при конвертации в редактируемый формат или при создании поискового слоя в PDF.
  • Интерфейс и интеграция: графический пользовательский интерфейс для настольного использования; возможная поддержка командной строки или API в расширённых версиях для интеграции в рабочие процессы.
  • Лицензирование и ограничения: наличие бесплатной версии с функциональными ограничениями и платной коммерческой версии без ограничений по объёму обработки, а также возможные лицензионные условия для корпоративного развертывания.
  • Применение: типичные сценарии включают оцифровку бумажных документов, создание архивов с полнотекстовым поиском, извлечение текста для последующего редактирования и подготовку материалов для документоведения и юридических архивов.
Подробнее