ABBYY Cloud OCR SDK

ABBYY Cloud OCR SDK — это облачный сервис и набор программных компонентов для распознавания текста и извлечения данных из изображений и документов. Он предназначен для автоматизации процессов оцифровки, обработки входящей документации и интеграции функций оптического распознавания текста (OCR) в пользовательские приложения через REST‑интерфейс. Решение поддерживает работу с различными форматами входных данных, преобразование результатов в структурированные форматы и экспорт в документы с возможностью поиска по тексту.

Продукт развивался как часть линейки программных средств ABBYY в области распознавания текста и обработки информации; информация о конкретных версиях и коммерческих предложениях может меняться со временем. В общей форме ABBYY Cloud OCR SDK сочетает в себе облачную инфраструктуру для выполнения задач OCR и набор API/SDK для разных платформ, позволяя разработчикам отправлять изображения на сервер, получать распознанный текст и результаты извлечения данных, а также получать готовые файлы в популярных форматах.

Распознавание печатного и рукописного текста: преобразование изображений и сканов в машинно-читаемый текст с поддержкой нескольких языков.
Извлечение структурированных данных: автоматическое выделение полей из форм, визиток, паспортных данных MRZ и других типизированных документов.
Работа с штрихкодами и 2D-кодами: распознавание и декодирование различных типов штрихкодов, встроенное в процесс обработки изображений.
Конвертация в поисковые форматы: генерация searchable PDF, Microsoft Word и Excel файлов с сохранением структуры документа и возможностью поиска по тексту.
REST API и SDK: программные интерфейсы для интеграции с веб‑ и мобильными приложениями, включая методы загрузки изображений, управления заданиями и получения результатов.
Поддержка форматов входных и выходных данных: гибкая работа с распространёнными графическими и документными форматами, настройка параметров обработки и качества.
Пакетная обработка и масштабирование: возможности для массовой обработки документов и масштабирования вычислений в облаке в зависимости от нагрузки.
Настройки точности и предобработки изображений: инструменты коррекции качества сканов, удаления шума и выравнивания текста для повышения точности распознавания.
Безопасность и контроль доступа: механизмы аутентификации и управления доступом для использования API в корпоративных сценариях (реализация и детали зависят от конфигурации сервиса).
Локализация и поддержка языков: многопользовательская поддержка ряда языков для распознавания и готовые словари/модели для повышения качества на конкретных языках.