ABBYY Cloud OCR SDK — это облачный сервис и набор программных компонентов для распознавания текста и извлечения данных из изображений и документов. Он предназначен для автоматизации процессов оцифровки, обработки входящей документации и интеграции функций оптического распознавания текста (OCR) в пользовательские приложения через REST‑интерфейс. Решение поддерживает работу с различными форматами входных данных, преобразование результатов в структурированные форматы и экспорт в документы с возможностью поиска по тексту.
Продукт развивался как часть линейки программных средств ABBYY в области распознавания текста и обработки информации; информация о конкретных версиях и коммерческих предложениях может меняться со временем. В общей форме ABBYY Cloud OCR SDK сочетает в себе облачную инфраструктуру для выполнения задач OCR и набор API/SDK для разных платформ, позволяя разработчикам отправлять изображения на сервер, получать распознанный текст и результаты извлечения данных, а также получать готовые файлы в популярных форматах.
- Распознавание печатного и рукописного текста: преобразование изображений и сканов в машинно-читаемый текст с поддержкой нескольких языков.
- Извлечение структурированных данных: автоматическое выделение полей из форм, визиток, паспортных данных MRZ и других типизированных документов.
- Работа с штрихкодами и 2D-кодами: распознавание и декодирование различных типов штрихкодов, встроенное в процесс обработки изображений.
- Конвертация в поисковые форматы: генерация searchable PDF, Microsoft Word и Excel файлов с сохранением структуры документа и возможностью поиска по тексту.
- REST API и SDK: программные интерфейсы для интеграции с веб‑ и мобильными приложениями, включая методы загрузки изображений, управления заданиями и получения результатов.
- Поддержка форматов входных и выходных данных: гибкая работа с распространёнными графическими и документными форматами, настройка параметров обработки и качества.
- Пакетная обработка и масштабирование: возможности для массовой обработки документов и масштабирования вычислений в облаке в зависимости от нагрузки.
- Настройки точности и предобработки изображений: инструменты коррекции качества сканов, удаления шума и выравнивания текста для повышения точности распознавания.
- Безопасность и контроль доступа: механизмы аутентификации и управления доступом для использования API в корпоративных сценариях (реализация и детали зависят от конфигурации сервиса).
- Локализация и поддержка языков: многопользовательская поддержка ряда языков для распознавания и готовые словари/модели для повышения качества на конкретных языках.