Tencent Cloud OCR

Tencent Cloud OCR — это сервис оптического распознавания символов, предоставляемый облачной платформой Tencent Cloud. Он предназначен для преобразования текстовых изображений в редактируемые текстовые данные, что облегчает автоматизацию ввода информации и обработку документов. Сервис поддерживает распознавание как печатного, так и рукописного текста, включая визитки, чеки и различные документы.

Основанный на алгоритмах глубокого обучения, Tencent Cloud OCR обеспечивает высокую точность распознавания и способен обрабатывать изображения с различными искажениями, такими как перспективные искажения, нерегулярное освещение и частичное перекрытие текста. Сервис предоставляет разработчикам доступ к API и SDK, что упрощает интеграцию в различные приложения и системы.

Поддержка печатного и рукописного текста: распознавание текста на визитках, чеках, удостоверениях личности, водительских правах, свидетельствах о регистрации транспортных средств и других документах.
Высокая точность распознавания: средняя точность распознавания печатного текста составляет более 95%, рукописного — более 90%.
Устойчивость к искажениям: поддержка распознавания текста в ландшафтной и портретной ориентации, а также в условиях перспективных искажений, нерегулярного освещения и частичного перекрытия.
Многоязычная поддержка: возможность распознавания текста на различных языках, включая китайский, английский, японский, корейский, испанский, французский, немецкий и португальский.
Гибкость и настраиваемость: возможность настройки сервиса под специфические требования пользователя, включая создание пользовательских шаблонов для распознавания.
Интеграция с другими сервисами Tencent Cloud: возможность использования OCR в сочетании с другими облачными сервисами Tencent для создания комплексных решений.
Поддержка различных форматов изображений: возможность обработки изображений в форматах JPG, PNG, TIFF и PDF.
Высокая скорость обработки: средняя скорость распознавания составляет 2 миллисекунды на символ при использовании GPU и 6 миллисекунд при использовании CPU.
Поддержка различных типов документов: возможность распознавания текста на удостоверениях личности, водительских правах, свидетельствах о регистрации транспортных средств, бизнес-лицензиях, визитках и других документах.