Yandex Vision OCR

Yandex Vision OCR — это сервис оптического распознавания символов (OCR), предоставляемый Яндекс.Облаком. Он предназначен для извлечения текста из изображений и PDF-документов с помощью моделей машинного обучения. Сервис предоставляет API, поддерживающее как синхронный, так и асинхронный режимы работы, что позволяет интегрировать функциональность в различные приложения и системы автоматизации.

С помощью Yandex Vision OCR пользователи могут распознавать печатный и рукописный текст, а также обрабатывать документы, содержащие таблицы и сложное форматирование. Сервис поддерживает более 40 языков, автоматически определяя язык текста, и предоставляет возможность выбора специализированных моделей для повышения точности распознавания в зависимости от типа документа.

Поддержка форматов: JPEG, PNG, PDF (до 20 МБ и 300 страниц).
Режимы работы: синхронный и асинхронный.
Языковая поддержка: более 40 языков с автоматическим определением языка.
Специализированные модели: для печатного и рукописного текста, таблиц, шаблонных документов.
Интерфейсы: REST и gRPC API для интеграции в различные приложения.
Поддержка шаблонов: возможность распознавания документов по заранее определённым шаблонам (например, паспорта, водительские удостоверения).
Обработка сложных документов: поддержка многоколоночного текста и таблиц.
Интеграция с другими сервисами: возможность использования в сочетании с другими сервисами Яндекс.Облака для создания комплексных решений.