Аналоги ScanTailor Advanced

ABBYY FineReader PDF

Бесплатно
Windows
macOS
iOS

ABBYY FineReader PDF — коммерческое программное обеспечение для оптического распознавания текста (OCR) и работы с PDF-документами, предназначенное для конвертации отсканированных изображений и PDF-файлов в редактируемые и индексируемые форматы, включая Microsoft Word, Excel и поисковые PDF; сочетает алгоритмы распознавания текста, обработки изображений и инструментов для редактирования, сравнения и аннотирования документов, поддерживает множество языков и сохраняет структуру исходного документа, включая форматирование и макет, что делает его применимым в офисной автоматизации, архивации и цифровой обработке документов в бизнесе и государственных учреждениях.

ScanTailor Advanced

Бесплатно
Открытый исходный код
Windows
macOS
Linux

Сайт: github.com/4lex4/scantailor-advanced

ScanTailor Advanced — программный инструмент для постобработки отсканированных страниц, предназначенный для подготовки изображений к последующему экспорту в форматах, пригодных для чтения и архивирования. Проект представляет собой форк или развитие идей оригинального ScanTailor и ориентирован на интерактивную обработку пакетов страниц: разрезание, выравнивание, коррекцию полей, очистку от артефактов и подготовку к объединению в итоговый файл. В документации и описаниях он обычно позиционируется как средство для обработки как одиночных страниц, так и многотомных сканов с поддержкой партии задач и сохранением промежуточных настроек.

Исторически информация о проекте может быть ограничена или фрагментарна, поэтому часть сведений основана на общепринятых практиках обработки сканов и описаниях похожих инструментов. Типичные возможности и рабочие сценарии ScanTailor Advanced включают автоматическое и ручное выравнивание страниц, выбор активной области, удаление и добавление полей, разделение разворотов на отдельные страницы, а также подготовку итоговой последовательности изображений для экспорта в PDF или DjVu. Интерфейс ориентирован на поэтапную обработку, где пользователь проходит через набор этапов и может возвращаться к предыдущим шагам для корректировки параметров.

  • Разделение разворотов: автоматическое или ручное разрезание изображений, содержащих два или более страниц, на отдельные страницы.
  • Выравнивание страниц: коррекция наклона и геометрии изображений для получения ровного текста и оптимального качества OCR-процессов.
  • Управление полями: удаление лишних полей, добавление или выравнивание полей для стандартизации размеров страниц в документе.
  • Выбор содержимого: определение области страницы, содержащей основной текст или изображение, с возможностью ручной корректировки маски.
  • Очистка артефактов: базовые операции по удалению пятен, шумов и плоттинга фона для улучшения визуального качества сканов.
  • Пакетная обработка: применение одинаковых или похожих настроек к группе страниц и сохранение промежуточных результатов для последующей правки.
  • Экспорт в PDF/DjVu: формирование итоговых файлов с учётом заданных полей, порядка страниц и настроек качества изображений.
  • Интерактивный рабочий процесс: пошаговый интерфейс, позволяющий просматривать результат на каждом этапе и вносить изменения до финального экспорта.
Подробнее