Аналоги a9t9

Adobe Acrobat Pro

Windows

macOS

Android

iOS

Adobe Acrobat Pro — коммерческое приложение компании Adobe Systems, предоставляющее инструменты для создания, редактирования, управления и конвертации документов в формате PDF; включает встроенные функции оптического распознавания текста (OCR) для преобразования отсканированных изображений и PDF с изображениями в редактируемый и индексируемый текст, поддерживает пакетную обработку, распознавание многоколоночных и многоязычных документов, корректировку и выравнивание страниц, экспорт результатов в форматы Microsoft Word, Excel и другие, а также интеграцию с облачными сервисами и средствами защиты документов, такими как шифрование и цифровые подписи.

Подробнее...

SAP Document Information Extraction

SAP Document Information Extraction — облачное решение для автоматизированного извлечения данных из документов, разработанное компанией SAP; использует комбинацию предобученных моделей машинного обучения и правил для распознавания структуры и семантики различных типов документов (счета, заказы, контракты и т.д.), извлекает ключевые поля, выполняет валидацию и сопоставление с бизнес-объектами в корпоративных приложениях, интегрируется с экосистемой SAP для автоматизации процессов ввода данных, сокращения ручной обработки и повышения точности учета и аналитики.

Подробнее...

ABBYY FineReader PDF

Windows

macOS

iOS

ABBYY FineReader PDF — коммерческое программное обеспечение для оптического распознавания текста (OCR) и работы с PDF-документами, разработанное компанией ABBYY; предоставляет инструменты для конвертации сканированных изображений и отсканированных документов в редактируемые и поисковые форматы (например, DOCX, PDF/A, TXT), сохраняет исходное форматирование и структуру страниц, включает функции сравнения документов, объединения и редактирования PDF, поддержку более сотни языков распознавания и возможности пакетной обработки, предназначено для использования в офисных и профессиональных средах для автоматизации документооборота и цифровизации бумажных архивов.

Подробнее...

Soda PDF

Windows

macOS

Linux

Android

iOS

Soda PDF — коммерческое программное обеспечение для создания, просмотра, редактирования и конвертации PDF-документов, разработанное компанией LULU Software; включает инструменты для объединения и разделения файлов, распознавания текста (OCR), аннотирования, защиты паролем и подписи документов, поддерживает работу с облачными хранилищами и пакетную обработку, доступно в виде настольных приложений для Windows и онлайн-сервиса, ориентировано на пользователей и организации, которым требуется универсальное решение для управления PDF-файлами.

Подробнее...

Mercury OCR

Windows

Mercury OCR — программное обеспечение для оптического распознавания текста, разработанное для преобразования изображений и сканов документов в редактируемый текст с поддержкой множества языков и форматов; функционально аналогично a9t9, включает модули предобработки изображений (коррекция перспективы, уменьшение шума), распознавания символов с использованием гибридных алгоритмов машинного обучения и словарной постобработки для повышения точности, экспорт результатов в текстовые и документные форматы, а также предоставляет инструменты пакетной обработки и интеграции через API для автоматизации рабочих процессов.

Подробнее...

ABBYY Cloud OCR SDK

ABBYY Cloud OCR SDK — облачный сервис оптического распознавания символов, разработанный компанией ABBYY, предоставляющий API для извлечения текста и структуры из изображений и PDF-документов; поддерживает множественные языки, распознавание таблиц и форм, сохранение результатов в различных форматах (TXT, PDF, DOCX и др.), адаптируется под мобильные и серверные приложения и используется для автоматизации ввода данных, индексирования документов и создания поисковых копий с возможностью настройки качества распознавания и постобработки.

Подробнее...

CuneiForm

Открытый исходный код

Windows

Linux

CuneiForm — оптическая система распознавания текста, разработанная компанией Cognitive Technologies; представляет собой программный комплекс для преобразования отсканированных документов и изображений в редактируемый машинный текст с поддержкой множества языков и различных форматов ввода, включая печатный и рукописный текст, обладает функциями распознавания макета страницы, сохранения структуры документа и экспорта в распространённые форматы, применяется в архивировании, автоматизации ввода данных и цифровой обработке документов.

Подробнее...

Hypatos

Hypatos — программный инструмент для оптического распознавания и интерактивного решения математических выражений и задач, предназначенный для автоматизации ввода, упрощения и проверки вычислений; сочетает распознавание рукописного и печатного текста с алгоритмами символьной алгебры и численного анализа, поддерживает разбор уравнений, упрощение выражений, подстановку значений и пошаговую проверку решений, ориентирован на использование в образовательных платформах, приложениях для заметок и научно-исследовательских рабочих процессах, предлагая API для интеграции с внешними сервисами и инструментами автоматизации.

Подробнее...

ScanTailor

Открытый исходный код

Windows

macOS

Linux

ScanTailor — свободное кроссплатформенное приложение для постобработки отсканированных страниц, предназначенное для подготовки изображений к оптическому распознаванию текста и печати; включает функции разделения страниц, выравнивания, коррекции перспективы, удаления полей, выравнивания контрастности и разметки областей текста и изображений, поддерживает пакетную обработку и сохраняет результаты в стандартных растровых форматах, ориентировано на использование в рабочих процессах оцифровки с открытым исходным кодом.

Подробнее...

gocr

Открытый исходный код

Windows

macOS

Linux

gocr — свободная программа оптического распознавания символов (OCR), предназначенная для извлечения текста из растровых изображений; разработанная как простое и кроссплатформенное решение, она поддерживает распознавание печатных символов на различных языках, обрабатывает изображения в форматах PNM и TIFF, реализует алгоритмы сегментации и распознавания символов с возможностью настройки параметров для улучшения точности и интеграции в автоматизированные конвейеры обработки изображений; проект известен своей лёгкостью, открытым исходным кодом и использовался в сочетании с другими инструментами для построения более сложных систем распознавания, хотя уступает современным коммерческим и нейросетевым решениям по точности на сложных макетах.

Подробнее...

Amazon Textract

Amazon Textract — облачный сервис оптического распознавания текста и извлечения структурированных данных, разработанный Amazon Web Services; он автоматически анализирует изображения и PDF-документы для распознавания печатного и рукописного текста, таблиц, форм и ключевых полей, возвращая результаты в машиночитаемых форматах с возможностью интеграции в рабочие процессы и приложениях для автоматизации обработки документов.

Подробнее...

Capture2Text

Открытый исходный код

Windows

macOS

Linux

Capture2Text — бесплатная утилита оптического распознавания текста с открытым исходным кодом для Windows, позволяющая быстро извлекать текст из выбранных областей экрана с помощью горячих клавиш; поддерживает распознавание текста на нескольких языках, экспорт в буфер обмена и файл, а также базовые функции автоматизации и настройки зон захвата, что делает её удобным инструментом для извлечения текста из изображений, скриншотов и окон приложений.

Подробнее...

SikuliX

Открытый исходный код

Windows

macOS

Linux

SikuliX — это инструмент автоматизации графического пользовательского интерфейса с открытым исходным кодом, который использует распознавание образов для поиска и взаимодействия с элементами экрана; разработанный как продолжение проекта Sikuli, он позволяет писать скрипты на языке Jython, Java или JavaScript для эмуляции кликов, ввода текста и управления окнами, поддерживает захват и использование скриншотов в качестве шаблонов, интеграцию с другими Java-библиотеками и тестирование приложений, и применяется для автоматизации повторяющихся задач, тестирования GUI и создания макросов в средах, где традиционные инструменты автоматизации на основе API недоступны.

Подробнее...

Rossum

Rossum — система оптического распознавания символов и корректировки текста, разработанная как аналог сервиса a9t9; сочетает методы машинного обучения и эвристических правил для распознавания рукописного и печатного текста, обработки ошибок OCR и преобразования изображений в редактируемые текстовые форматы, поддерживает несколько языков и форматов ввода, ориентирована на интеграцию в рабочие процессы автоматизации документооборота и цифровой архивации, обеспечивая высокую точность распознавания за счёт адаптивных моделей и модулей постобработки.

Подробнее...

LEADTOOLS OCR

Windows

macOS

Linux

LEADTOOLS OCR — коммерческая библиотека для оптического распознавания текста, входящая в набор SDK LEADTOOLS и предоставляющая инструменты для извлечения текста из растровых изображений и сканированных документов; поддерживает многоплатформенное внедрение, работу с множеством форматов изображений, распознавание на различных языках, распознавание печатного и рукописного текста, а также функции предварительной обработки изображений (дешумление, выравнивание, коррекция наклона), постобработки (исправление ошибок, анализ макета) и интеграции с документными рабочими процессами и хранилищами данных.

Подробнее...

FreeOCR

Windows

FreeOCR — бесплатная программа для оптического распознавания текста (OCR), предназначенная для извлечения текста из отсканированных изображений и PDF-документов; поддерживает различные форматы ввода, многоязычность и интеграцию с Tesseract в качестве движка распознавания, обеспечивает базовые функции предварительной обработки изображений (такие как обрезка и поворот) и экспорт распознанного текста в редактируемые форматы, ориентирована на пользователей, которым требуется простое и доступное решение для конвертации изображений в текст без сложных настроек.

Подробнее...

Google Drive OCR

Android

iOS

Google Drive OCR — встроенная функция сервиса Google Drive для оптического распознавания текста в изображениях и PDF-документах, которая извлекает редактируемый текст и метаданные при загрузке файлов; используется для автоматической индексации содержимого, облегчения поиска по документам и конвертации отсканированных материалов в редактируемые форматы, поддерживает множество языков и интегрируется с другими инструментами Google для совместной работы и хранения.

Подробнее...

Yandex Vision OCR

Yandex Vision OCR — сервис оптического распознавания текста, разработанный компанией «Яндекс», предназначенный для извлечения и структурирования текстовой информации из изображений и отсканированных документов; поддерживает распознавание печатного и рукописного текста на нескольких языках, распознавание таблиц и полей форм, автоматическое определение ориентации и сегментацию страниц, обеспечивает интеграцию через API для использования в мобильных приложениях и корпоративных системах, включает механизмы постобработки для коррекции ошибок и привязки результатов к форматам сохранения (например, TXT, PDF, DOCX), а также учитывает требования к конфиденциальности данных и масштабируемости при обработке больших объёмов изображений.

Подробнее...

Google Cloud Vision OCR

Google Cloud Vision OCR — это облачный сервис оптического распознавания текста, входящий в набор инструментов Google Cloud Vision, который извлекает текстовую информацию из изображений и сканированных документов с поддержкой множества языков и форматов; система использует методы машинного обучения и нейронных сетей для обнаружения и сегментации текста, распознавания символов, определения структурных элементов (строки, абзацы, блоки) и сопоставления их с геометрией на изображении, обеспечивая высокую точность на разнообразных типах изображений, включая фотографии, отсканированные страницы и сложные макеты, а также предоставляя API для интеграции с приложениями, автоматизации рабочих процессов и последующей обработки результатов (например, индексирования, поиска и анализа).

Подробнее...

ABBYY FineReader

Windows

macOS

Android

iOS

ABBYY FineReader — коммерческое программное обеспечение для оптического распознавания текста (OCR) и работы с PDF-документами, разработанное компанией ABBYY; предназначено для преобразования отсканированных изображений, фотографий и PDF-файлов в редактируемые и поисковые форматы с сохранением структуры документа, включая распознавание многоязычных текстов, таблиц и формата страницы, а также предоставляет инструменты для сравнения документов, автоматизации пакетной обработки и интеграции в корпоративные рабочие процессы.

Подробнее...

OmniPage

Windows

OmniPage — коммерческое программное обеспечение для оптического распознавания текста (OCR), разработанное для преобразования отсканированных документов, изображений и PDF-файлов в редактируемые и индексируемые форматы; поддерживает работу с множеством языков, сохраняет структуру оригинальных документов, включая макет, таблицы и шрифты, и предлагает инструменты для пакетной обработки, интеграции с рабочими процессами и конвертации в форматы вроде Microsoft Word, Excel и PDF/A, применяя алгоритмы распознавания символов и постобработки для повышения точности вывода.

Подробнее...

PaddleOCR

Открытый исходный код

Windows

macOS

Linux

PaddleOCR — это открытая платформа оптического распознавания текста (OCR), разработанная командой PaddlePaddle в Baidu, представляющая собой набор оптимизированных моделей и инструментов для извлечения текста из изображений, поддерживающая сегментацию текста, распознавание символов и постобработку для множества языков и шрифтов; проект ориентирован на высокую точность и производительность в реальных задачах (сканы, фото, документы), предлагает готовые предобученные модели, гибкие конвейеры обработки и возможности для дообучения и оптимизации под встраиваемые и серверные среды, что делает его популярным решением в исследованиях и промышленном применении OCR.

Подробнее...

Kofax OmniPage

Windows

Kofax OmniPage — коммерческое программное обеспечение для оптического распознавания текста (OCR), разработанное для преобразования бумажных документов, отсканированных изображений и файлов PDF в редактируемые и индексируемые цифровые форматы; поддерживает распознавание множества языков, сохранение структуры документа (включая колонки, таблицы и изображения), интеграцию с рабочими процессами документооборота и пакетную обработку, а также предоставляет инструменты для проверки и корректировки результатов распознавания, экспорт в популярные форматы (Word, Excel, searchable PDF и др.) и автоматизацию задач через скрипты и API.

Подробнее...

EasyOCR

Открытый исходный код

Windows

macOS

Linux

EasyOCR — открытая библиотека оптического распознавания текста на Python, разработанная для извлечения письменной информации из изображений и сканов с поддержкой более ста языков; использует сверточные нейронные сети и рекуррентные слои для сегментации и распознавания символов, обеспечивает простую интеграцию в проекты благодаря интуитивному API, настраиваемым моделям и возможности работы с различными шрифтами и форматами изображений, широко применяется для автоматизации ввода данных, цифровизации документов и предобработки текстовой информации в системах компьютерного зрения.

Подробнее...

SimpleOCR

Windows

SimpleOCR — это программное обеспечение оптического распознавания текста (OCR), предназначенное для преобразования отсканированных изображений и фотографий документов в редактируемый цифровой текст; разработанное с упором на простоту использования, оно поддерживает базовые функции распознавания печатного текста на нескольких языках, предлагает инструменты для предварительной обработки изображений (такие как удаление шума и выпрямление), экспорт распознанного текста в стандартные форматы и интеграцию с офисными приложениями, при этом ориентировано на индивидуальных пользователей и малые организации, которым необходима быстрая и экономичная конвертация бумажных документов в цифровой формат.

Подробнее...

Adobe Acrobat OCR

Windows

macOS

Android

iOS

Adobe Acrobat OCR — встроенная в семейство приложений Adobe функция оптического распознавания текста, предназначенная для преобразования отсканированных документов и изображений в редактируемые и индексируемые текстовые данные; обеспечивает распознавание многоязычных текстов, сохранение макета и форматирования, поддержку поиска по содержимому PDF, интеграцию с инструментами редактирования и экспорта, а также механизмы обработки пакетных заданий и улучшения качества изображений для повышения точности распознавания.

Подробнее...

Tesseract OCR

Открытый исходный код

Windows

macOS

Linux

Android

iOS

Tesseract — свободная система оптического распознавания текста (OCR) с открытым исходным кодом, первоначально разработанная компанией Hewlett-Packard в 1985–1995 годах и впоследствии поддерживаемая Google; поддерживает множество языков, предлагает модульную архитектуру для предобработки изображений, сегментации и распознавания символов, использует современные методы машинного обучения и LSTM-сети для повышения точности, поставляется как библиотека с командной строкой и обширными параметрами настройки, применяется в цифровизации документов, архивных проектах и встраиваемых решениях и распространяется под лицензией Apache 2.0.

Подробнее...

CamScanner

Windows

macOS

Android

iOS

CamScanner — мобильное приложение для сканирования документов, позволяющее с помощью камеры смартфона или планшета создавать цифровые копии бумажных носителей; предлагает автоматическое кадрирование и коррекцию перспективы, улучшение качества изображений, распознавание текста (OCR), организацию и экспорт файлов в форматы PDF и JPEG, а также функции для совместного доступа, синхронизации между устройствами и базового редактирования, применяемое как частными пользователями, так и в деловой среде.

Подробнее...

gImageReader

Открытый исходный код

Windows

macOS

Linux

gImageReader — свободная программа с графическим интерфейсом для движка OCR Tesseract, предназначенная для распознавания текста на изображениях и в PDF-документах; поддерживает пакетную обработку, предварительную обработку изображений (включая поворот, кадрирование и коррекцию контраста), редактирование и экспорт распознанного текста в различные форматы, многоязычный интерфейс и возможность настройки параметров распознавания, что делает её удобным инструментом для извлечения текста из сканов и фотографий в средах Linux и Windows.

Подробнее...

OCR.space

OCR.space — это онлайн-сервис и API для оптического распознавания текста (OCR), предоставляющий автоматическую конвертацию изображений и PDF-файлов в редактируемый текст с поддержкой множества языков и форматов; платформа предлагает как бесплатный веб-интерфейс, так и платные планы с повышенной точностью, обработкой больших объёмов и дополнительными возможностями (например, распознавание таблиц, настройка предобработки изображений и возвращение результатов в формате JSON), используется для извлечения текста из сканов, фотографий документов и PDF в приложениях автоматизации, индексирования и цифровой архивации.

Подробнее...

Transkribus

Transkribus — платформа и набор инструментов для распознавания, транскрибирования и анализа исторических рукописных и печатных документов с использованием методов машинного обучения, включая сегментацию страниц, распознавание текста (HTR/OCRE) и извлечение метаданных; разработанная для архивов, библиотек и исследователей, система поддерживает обучение пользовательских моделей на примерах, пакетную обработку больших коллекций, совместную работу и экспорт результатов в разнообразные форматы, а также интеграцию с другими цифровыми архивными решениями.

Подробнее...

Cloudmersive OCR

Cloudmersive OCR — облачное программное решение для распознавания текста (OCR), предоставляющее API и SDK для извлечения печатного и рукописного текста из изображений и PDF-документов; продукт поддерживает множество языков, автоматическую предобработку изображений (например, коррекцию ориентации, удаление шума и улучшение контраста) и интеграцию с веб- и мобильными приложениями, ориентирован на масштабируемые сценарии использования в бизнесе и разработке, включая пакетные преобразования, обработку документов с табличными данными и обеспечение высокого уровня точности при различном качестве исходных материалов.

Подробнее...

Readiris

Windows

macOS

Readiris — коммерческое программное обеспечение для оптического распознавания текста (OCR), разработанное компанией I.R.I.S. и предназначенное для превращения сканированных документов, изображений и PDF-файлов в редактируемые и индексируемые форматы; поддерживает распознавание на нескольких языках, экспорт в форматы Word, Excel и PDF с возможностью сохранения структуры и форматирования, включает инструменты для пакетной обработки, сжатия и управления документами, а также интеграции с облачными сервисами и рабочими процессами, применимо в офисной и деловой среде для автоматизации ввода данных и цифровизации архивов.

Подробнее...

Genius Scan

Android

iOS

Genius Scan — мобильное приложение для сканирования документов, разработанное для быстрого создания качественных цифровых копий с камер смартфонов; поддерживает автоматическое обнаружение границ, коррекцию перспективы и улучшение изображения, позволяет сохранять файлы в форматах PDF и JPEG, объединять страницы в многостраничные документы, применять базовые инструменты для обработки (обрезка, поворот, фильтры) и экспортировать или отправлять документы по электронной почте, в облачные хранилища и в другие приложения; доступно на платформах iOS и Android, имеет как бесплатную базовую версию, так и платные опции с расширенными возможностями управления документами и интеграцией.

Подробнее...

Scanbot

Android

iOS

Scanbot — мобильное приложение для сканирования документов и обработки изображений, разработанное для быстрого оцифровывания бумажных носителей с помощью камеры смартфона; предоставляет функции автоматического кадрирования и выравнивания, оптического распознавания текста (OCR), сохранения в формате PDF и изображений, организацию и поиск документов, а также интеграцию с облачными хранилищами и возможность защиты файлов паролем, ориентировано на удобство использования как частными пользователями, так и профессионалами для упрощения рабочих процессов по архивированию и обмену документами.

Подробнее...

NAPS2

Открытый исходный код

Windows

macOS

Linux

NAPS2 (Not Another PDF Scanner 2) — бесплатная и открытая программа для сканирования документов, поддерживающая множество сканеров через драйверы TWAIN и WIA; предоставляет удобный интерфейс для создания многостраничных PDF, TIFF и других форматов, включает функции предварительного просмотра, обрезки, поворота, обработки изображений (коррекция контраста и яркости, удаление шума), оптического распознавания текста (OCR) через внешние движки и параметры пакетной обработки, ориентирована на простое и быстрое оцифровывание документов как для частных пользователей, так и для небольших организаций.

Подробнее...

Asprise OCR

Windows

macOS

Linux

Asprise OCR — программная библиотека и сервис для оптического распознавания текста, предоставляющий API для извлечения текста из изображений и PDF-документов на множестве языков; поддерживает как локальную интеграцию в настольных и серверных приложениях, так и облачные вызовы, обеспечивает распознавание печатного и рукописного текста, настройку уровней точности и форматов вывода (TXT, PDF с текстовым слоем, XML), а также предоставляет функции предварительной обработки изображений и постобработки для повышения качества распознавания и сохранения структуры документа.

Подробнее...

OnlineOCR.net

OnlineOCR.net — веб‑сервис для оптического распознавания текста (OCR), предоставляющий пользователям возможность преобразовывать отсканированные изображения и PDF‑документы в редактируемые форматы, такие как Microsoft Word, Excel и простой текст; поддерживает множество языков, распознавание таблиц и пакетную обработку файлов, действует через простой веб‑интерфейс без необходимости установки локального ПО и используется для извлечения текста из изображений, архивирования документов и повышения доступности бумажных материалов в цифровых рабочих процессах.

Подробнее...

Calamari OCR

Открытый исходный код

Windows

macOS

Linux

Calamari OCR — это открытая система оптического распознавания текста, основанная на современных методах глубокого обучения и предназначенная для конвертации изображений рукописного и печатного текста в машинно-читаемый формат; проект поддерживает обучение и гибкую настройку моделей на пользовательских наборах данных, использует последовательные сверточно-рекуррентные архитектуры и методы трансферного обучения для повышения точности распознавания, обеспечивает поддержку множества шрифтов и языков, интеграцию с рабочими процессами для пакетной обработки документов и активно применяется в научных, архивных и цифровизационных проектах.

Подробнее...

IronOCR

Windows

macOS

Linux

IronOCR — коммерческая библиотека распознавания текста для платформы .NET, предоставляющая средства оптического распознавания (OCR) для извлечения текста из изображений и PDF-документов; поддерживает работу с разными языками и шрифтами, включает инструменты предварительной и постобработки изображений (коррекция наклона, бинаризация, удаление шума), интеграцию с популярными форматами изображений и потоковой обработкой, а также API для извлечения структурированных данных (таблицы, формы) и настройки точности распознавания в серверных и настольных приложениях.

Подробнее...

SimpleIndex

Windows

SimpleIndex — это программное обеспечение для массовой индексации и автоматизированной обработки документов, предназначенное для упрощения сканирования, распознавания текста (OCR), извлечения метаданных и загрузки данных в базы данных или системы управления документами; приложение поддерживает работу с большими объёмами файлов, настраиваемые рабочие процессы и шаблоны извлечения полей для ускорения цифровой оцифровки, категоризации и поиска документов в корпоративных и мелкобизнесовых средах.

Подробнее...

Prizmo Go

iOS

Prizmo Go — мобильное приложение для оптического распознавания текста (OCR), разработанное для быстрого захвата и преобразования печатного и рукописного текста с помощью камеры смартфона; приложение поддерживает множество языков, автоматически выравнивает и обрезает изображения, предлагает функции редактирования распознанного текста и экспорта в форматы TXT и PDF, а также включает встроенные средства для озвучивания текста (TTS) и интеграцию с буфером обмена и облачными сервисами, что делает его удобным инструментом для сканирования документов, извлечения текста из книг и заметок и последующего использования на мобильных устройствах.

Подробнее...

Prizmo

macOS

iOS

Prizmo — коммерческое приложение для оптического распознавания текста (OCR) и обработки изображений документов, разработанное для macOS и iOS; поддерживает распознавание текста на множестве языков, включает инструменты постобработки для редактирования, экспорта и сохранения результатов в различных форматах (PDF, текстовые файлы), а также функции коррекции перспективы и улучшения качества сканов, применяется для цифровизации бумажных документов, извлечения текста из фотографий и повышения доступности контента.

Подробнее...

PDF Candy OCR

Windows

PDF Candy OCR — это веб‑ и настольный инструмент для оптического распознавания текста, разработанный для преобразования отсканированных изображений и PDF‑документов в редактируемые текстовые форматы; служба поддерживает распознавание нескольких языков, сохраняет исходное форматирование по возможности и предоставляет возможности пакетной обработки, интеграции в набор онлайн‑инструментов для работы с PDF и экспорт в распространённые форматы (например, DOCX, TXT), при этом ориентирована на простоту использования и доступна как бесплатная, так и платная версия с расширенным набором функций.

Подробнее...

Tesseract.js

Открытый исходный код

Tesseract.js — это библиотека на JavaScript, обеспечивающая распознавание текста (OCR) в браузере и на серверной стороне с использованием движка Tesseract OCR; она компилирует оригинальный движок на C/C++ в WebAssembly, предоставляя высокоуровневый API для загрузки изображений, настройки языковых моделей и обработки результатов, поддерживает множество языков и различные форматы ввода, позволяет выполнять асинхронную обработку и распараллеливание задач, часто применяется в веб-приложениях для извлечения текста из изображений, сканов и фотографий без необходимости установки нативного ПО.

Подробнее...

Transym OCR

Windows

Transym OCR — коммерческая программа оптического распознавания текста, разработанная компанией Transym Ltd., предназначенная для конвертации отсканированных документов и изображений в редактируемые текстовые форматы; отличается поддержкой множества языков и шрифтов, возможностью обучения словарю и шаблонам для повышения точности распознавания, интеграционными возможностями через API и командную строку, а также наличием функций пред- и постобработки изображений (коррекция наклона, устранение шума) для улучшения качества распознаваемого текста; применяется в бизнес-процессах автоматизации ввода данных, архивации документов и системах управления контентом.

Подробнее...

PaperScan

Windows

PaperScan — программное обеспечение для оптического распознавания текста (OCR) и управления сканированными изображениями, предоставляющее инструменты для захвата, обработки и конвертации бумажных документов в редактируемые и индексируемые форматы; поддерживает работу с различными сканерами и многослойными изображениями, включает функции автоматической коррекции изображений, пакетной обработки, распознавания на нескольких языках и экспорт в форматы PDF, DOCX и другие, ориентировано на упрощение цифровизации документов для последующего поиска, хранения и редактирования.

Подробнее...

OCRFeeder

Открытый исходный код

Linux

OCRFeeder — свободное программное обеспечение для оптического распознавания текста и постобработки документов, разработанное для упрощения сканирования, извлечения и редактирования текстовой информации из изображений и PDF; приложение поддерживает подключение нескольких движков OCR, предоставляет графический интерфейс для распознавания страниц, автоматического разбиения на блоки (текст, изображения), экспорт в различные форматы (включая PDF и ODT) и интеграцию с инструментами распознавания языка и корректировки макета, что делает его удобным решением для конвертации бумажных документов в редактируемые цифровые файлы.

Подробнее...

OCRmyPDF

Открытый исходный код

Windows

macOS

Linux

OCRmyPDF — свободная программа с открытым исходным кодом для распознавания текста в PDF-документах, добавляющая слой с распознанным текстом поверх изображений страниц без изменения исходного визуального представления; поддерживает пакетную обработку, автоматическое выравнивание и коррекцию ориентации, интеграцию с движками OCR (например, Tesseract), сохранение результатов в стандартизированном PDF/A для долгосрочного архива и предоставляет опции управления качеством распознавания и метаданными, применима для оцифровки архивных материалов, подготовки поиско-индексируемых документов и улучшения доступности.

Подробнее...

Nanonets

Nanonets — это облачная платформа на базе машинного обучения, специализирующаяся на автоматизации извлечения данных из документов и изображений с помощью моделей оптического распознавания символов (OCR) и сегментации; сервис предоставляет инструменты для обучения пользовательских моделей через загрузку примеров, поддерживает интеграцию с бизнес-процессами через API и коннекторы, ориентирован на обработку счётов, форм, накладных и других структурированных и полуструктурированных документов, обеспечивает масштабируемость, настройку под конкретные шаблоны и экспорт данных в стандартных форматах для дальнейшей автоматизированной обработки.

Подробнее...

Modi

Windows

macOS

Linux

Android

iOS

Modi — это модель генерации формул и математического текста, разработанная как аналог a9t9, предназначенная для распознавания, интерпретации и синтеза математических выражений в текстовом виде; она сочетает методы глубокого обучения и правил для преобразования изображений с рукописными или печатными уравнениями в семантически корректные LaTeX- или ASCII-представления, поддерживает многозадачность (оптическое распознавание формул, привязка контекста, постобработка для корректности синтаксиса) и ориентирована на интеграцию в образовательные, научные и аналитические приложения, предлагая гибкие API-интерфейсы и механизмы оценки качества распознавания.

Подробнее...

i2OCR

i2OCR — это бесплатный веб‑сервис для оптического распознавания текста (OCR), позволяющий извлекать текст из растровых изображений и PDF‑файлов на множестве языков; инструмент поддерживает загрузку файлов с компьютера и по URL, предлагает автоматическое определение языка и базовую постобработку результата, включая сохранение в формате TXT, DOCX и копирование в буфер обмена, при этом не требует установки программного обеспечения и ориентирован на простое и быстрое извлечение машинно‑читаемого текста для последующего редактирования и поиска.

Подробнее...

a9t9

Открытый исходный код

Windows

macOS

Linux

Android

iOS

Сайт: ocr.space

a9t9, известный также под брендом OCR.space, представляет собой набор онлайн-сервисов и клиентских утилит для оптического распознавания текста (OCR) из растровых изображений и файлов PDF. Проект включает веб-интерфейс для загрузки файлов, веб-API для автоматизированного доступа и ряд настольных или мобильных клиентов, часть из которых распространяется как открытое программное обеспечение. Основная цель платформы — преобразование изображений, отсканированных документов и фотоснимков в машинно-читаемый текст с поддержкой нескольких языков и форматов вывода.

Исторические подробности о происхождении и развитии проекта ограничены в общедоступных источниках, поэтому в тексте отмечается, что точная хронология и сведения о коммерческих структурах за платформой могут быть неполными. На практике сервис стал известен благодаря сочетанию бесплатных опций для одиночного использования, платных планов для профессиональных задач и наличию простого веб-API, позволяющего интегрировать распознавание текста в сторонние приложения и рабочие процессы. Важной частью экосистемы являются клиентские утилиты — включая графические интерфейсы для настольных систем и скрипты для автоматизации — некоторые из которых имеют открытые исходники.

Распознавание текста из изображений и PDF — основной функционал, поддерживает многоязычный ввод и распознаёт как печатный, так и частично рукописный текст.
Веб-API — интерфейс для программной отправки изображений и получения результатов в машинно-читаемом формате для интеграции в приложения и сервисы.
Поддержка форматов вывода — текстовые форматы и структурированные результаты, пригодные для последующей обработки или сохранения.
Клиентские утилиты — настольные и консольные приложения, облегчающие локальное использование сервиса; часть проектов предоставляется с открытым исходным кодом.
Бесплатные и платные планы — сочетание бесплатного доступа с ограничениями и коммерческих тарифов для повышения квот, скорости и конфиденциальности обработки.
Обработка многостраничных документов — возможность распознавать текст из многостраничных PDF и собирать результаты по страницам.
Конфигурация параметров распознавания — выбор языка, режима обработки и опций предобработки изображений для улучшения качества OCR.

Подробнее