Аналоги Transkribus

ABBYY FineReader PDF

Бесплатно
Windows
macOS
iOS

ABBYY FineReader PDF — коммерческое программное обеспечение для оптического распознавания текста (OCR) и управления документами, разработанное компанией ABBYY; предназначено для преобразования отсканированных изображений, PDF-файлов и фотографий в редактируемые и поисково-индексируемые форматы, поддерживает сохранение структуры документа, распознавание нескольких языков, экспорт в форматы Word, Excel и PDF, а также включает инструменты для сравнения документов и автоматизации рабочих процессов; используется в юридических, архивных и бизнес-приложениях для повышения доступности и управляемости бумажных архивов и электронных документов.

Transkribus

Бесплатно

Сайт: transkribus.eu

Transkribus — платформа для распознавания, транскрипции и публикации рукописных и печатных исторических документов, разработанная с целью поддержки исследований в области гуманитарных и архивных наук. Система объединяет инструменты для автоматического распознавания текста (HTR — Handwritten Text Recognition и OCR), ручной корректировки транскрипций, аннотирования и управления коллекциями. Пользователям предоставляются как предобученные модели, так и возможности обучения специализированных пользовательских моделей на основе загруженных образцов.

Платформа используется архивами, библиотеками, исследовательскими группами и частными лицами для оцифровки, структурирования и публикации исторических материалов. Transkribus обеспечивает рабочие процессы от загрузки изображений страниц до экспорта текста и публикации собраний, включая инструменты для оценки качества распознавания, коллективной работы и управления правами доступа. История проекта связана с академическими инициативами по цифровой культуре и развитием методов машинного обучения для анализа рукописных текстов.

  • Распознавание рукописного текста (HTR) — модели глубокого обучения для автоматической транскрипции рукописных и печатных источников.
  • Обучение пользовательских моделей — возможность создавать и дообучать модели на собственных датасетах для повышения точности на специфичных почерках.
  • Инструменты редактирования — интерфейсы для ручной корректировки распознанного текста и проверки результатов.
  • Аннотирование и разметка — поддержка добавления метаданных, тегов и структурной разметки документов.
  • Управление коллекциями — организация, хранение и публикация оцифрованных сборников с настройками доступа.
  • Экспорт и интеграция — экспорт транскриптов в стандартные форматы и интеграция с системами управления коллекциями и исследовательскими платформами.
  • Оценка качества — метрики точности распознавания и инструменты для оценки производительности моделей.
  • Коллективная работа — поддержка совместной работы нескольких пользователей над проектами и моделями.
Подробнее