IBM Watson Visual Recognition

Аналоги IBM Watson Visual Recognition

ABBYY FineReader PDF

Windows

macOS

iOS

ABBYY FineReader PDF — программный продукт компании ABBYY для оптического распознавания текста (OCR), обработки и конвертации PDF-документов, объединяющий инструменты сканирования, распознавания текста, редактирования и сравнения документов с сохранением структуры и форматирования; предназначен для автоматизации ввода данных и цифровой работы с бумагой в бизнесе и государственных учреждениях, поддерживает множество языков и форматов, обеспечивает экспорт в редактируемые форматы (например, Microsoft Word, Excel), встроенные функции поиска по распознанному тексту и элементы защиты конфиденциальности при работе с документами.

Подробнее...

IBM Watson Visual Recognition — облачный сервис компьютерного зрения, разработанный компанией IBM в составе платформы Watson. Сервис предназначен для анализа визуального контента: он выполняет обнаружение объектов, определение сцен, распознавание текста и классификацию изображений по набору предопределённых категорий. Пользователь может использовать как встроенные модели, так и создавать и обучать собственные классификаторы для специфических задач с помощью размеченных примеров.

Исторически сервис появился как часть набора инструментов Watson для работы с неструктурированными данными и неоднократно развивался в направлении гибкости обучения и интеграции с другими облачными компонентами IBM. В разных выпусках API обеспечивались возможности пакетной обработки изображений, анализа метаданных и настройки порогов уверенности. В ряде случаев продукция проходила реорганизацию в портфеле сервисов IBM, и информация о текущем состоянии сервиса может меняться; если официальных сведений о поддержке или доступности нет, это следует учитывать при планировании внедрения.

Обнаружение объектов: идентификация и локализация объектов внутри изображения по предобученным классам.
Классификация изображений: присвоение изображению одного или нескольких классов с оценками вероятности.
Пользовательские классификаторы: обучение собственных моделей на базе размеченных примеров для специфичных предметных областей.
Распознавание текста (OCR): извлечение текстовых данных из изображений и сцен с последующей постобработкой.
Анализ сцен и контекста: определение типа сцены, условий съёмки и контекстных характеристик изображения.
API и интеграция: предоставление RESTful API для встраивания в приложения и работы в составе других облачных сервисов.
Настройки уверенности: возможность задания порогов и фильтров по уровням вероятности для управления выдачей результатов.
Пакетная обработка и масштабирование: поддержка обработки больших объёмов изображений через облачную инфраструктуру.