Yandex Vision OCR — это сервис оптического распознавания символов (OCR), предоставляемый Яндекс.Облаком. Он предназначен для извлечения текста из изображений и PDF-документов с помощью моделей машинного обучения. Сервис предоставляет API, поддерживающее как синхронный, так и асинхронный режимы работы, что позволяет интегрировать функциональность в различные приложения и системы автоматизации.
С помощью Yandex Vision OCR пользователи могут распознавать печатный и рукописный текст, а также обрабатывать документы, содержащие таблицы и сложное форматирование. Сервис поддерживает более 40 языков, автоматически определяя язык текста, и предоставляет возможность выбора специализированных моделей для повышения точности распознавания в зависимости от типа документа.
- Поддержка форматов: JPEG, PNG, PDF (до 20 МБ и 300 страниц).
 - Режимы работы: синхронный и асинхронный.
 - Языковая поддержка: более 40 языков с автоматическим определением языка.
 - Специализированные модели: для печатного и рукописного текста, таблиц, шаблонных документов.
 - Интерфейсы: REST и gRPC API для интеграции в различные приложения.
 - Поддержка шаблонов: возможность распознавания документов по заранее определённым шаблонам (например, паспорта, водительские удостоверения).
 - Обработка сложных документов: поддержка многоколоночного текста и таблиц.
 - Интеграция с другими сервисами: возможность использования в сочетании с другими сервисами Яндекс.Облака для создания комплексных решений.