Readiris — коммерческое программное обеспечение для оптического распознавания символов (OCR) и обработки PDF, предназначенное для конвертации сканов, изображений и документов в редактируемые форматы. Программа разработана для распознавания печатного текста на различных языках, сохранения структуры документа и экспорта в форматы, такие как Microsoft Word, Excel, PDF, TXT и ePub, а также для объединения функций сканирования, индексации и управления цифровыми документами.
История разработки Readiris связана с развитием OCR-технологий в конце XX — начале XXI века; продукт прошёл несколько версий, в которых улучшались качество распознавания, поддержка языков и возможности экспорта. Readiris применяется как в корпоративных, так и в индивидуальных сценариях для оцифровки бумажных архивов, подготовки редактируемых копий документов и создания поисковых PDF-документов. В официальных описаниях и обзорах отмечаются функции предобработки изображения, коррекция ориентации и шумоподавление, позволяющие повысить точность распознавания на исходных материалах низкого качества.
- Распознавание текста (OCR) — преобразование печатного текста из сканов и изображений в редактируемые форматы с попыткой сохранить форматирование и структуру.
- Многоязычная поддержка — распознавание текста на множестве языков с возможностью выбора словарей и корректировок.
- Экспорт в различные форматы — сохранение результатов в DOCX, XLSX, PDF, TXT, ePub и других распространённых форматах.
- Создание поисковых PDF — генерация PDF-файлов с наложенным текстовым слоем для поиска и копирования содержимого.
- Инструменты предобработки изображений — автоматическая выравнивание, удаление шума, коррекция контраста и увеличение читабельности перед распознаванием.
- Аннотации и редактирование PDF — базовые возможности добавления комментариев и внесения простых правок в PDF-файлы.
- Пакетная обработка — одновременная обработка множества файлов для ускорения оцифровки больших объёмов документов.
- Интеграция с периферией — поддержка сканеров и подключение к системам управления документами для упрощения рабочего процесса.
- Распознавание таблиц и структур — попытки восстановления табличных данных и экспорт их в электронные таблицы.
- Синтез речи (Text-to-Speech) — функции воспроизведения распознанного текста голосом в некоторых версиях программы.