Аналоги a9t9
							
					
					Бесплатно✱
Открытый исходный код
Windows
macOS
Linux
 											ScanTailor — свободное кроссплатформенное приложение для постобработки отсканированных страниц, предназначенное для подготовки изображений к оптическому распознаванию текста и печати; включает функции разделения страниц, выравнивания, коррекции перспективы, удаления полей, выравнивания контрастности и разметки областей текста и изображений, поддерживает пакетную обработку и сохраняет результаты в стандартных растровых форматах, ориентировано на использование в рабочих процессах оцифровки с открытым исходным кодом.
						
									 
							
					
																Adobe Acrobat Pro — коммерческое приложение компании Adobe Systems, предоставляющее инструменты для создания, редактирования, управления и конвертации документов в формате PDF; включает встроенные функции оптического распознавания текста (OCR) для преобразования отсканированных изображений и PDF с изображениями в редактируемый и индексируемый текст, поддерживает пакетную обработку, распознавание многоколоночных и многоязычных документов, корректировку и выравнивание страниц, экспорт результатов в форматы Microsoft Word, Excel и другие, а также интеграцию с облачными сервисами и средствами защиты документов, такими как шифрование и цифровые подписи.
						
									 
							
					
																ABBYY Cloud OCR SDK — облачный сервис оптического распознавания символов, разработанный компанией ABBYY, предоставляющий API для извлечения текста и структуры из изображений и PDF-документов; поддерживает множественные языки, распознавание таблиц и форм, сохранение результатов в различных форматах (TXT, PDF, DOCX и др.), адаптируется под мобильные и серверные приложения и используется для автоматизации ввода данных, индексирования документов и создания поисковых копий с возможностью настройки качества распознавания и постобработки.
						
									 
							
					
					Бесплатно✱
Windows
macOS
iOS
 											ABBYY FineReader PDF — коммерческое программное обеспечение для оптического распознавания текста (OCR) и работы с PDF-документами, разработанное компанией ABBYY; предоставляет инструменты для конвертации сканированных изображений и отсканированных документов в редактируемые и поисковые форматы (например, DOCX, PDF/A, TXT), сохраняет исходное форматирование и структуру страниц, включает функции сравнения документов, объединения и редактирования PDF, поддержку более сотни языков распознавания и возможности пакетной обработки, предназначено для использования в офисных и профессиональных средах для автоматизации документооборота и цифровизации бумажных архивов.
						
									 
							
					
					Бесплатно✱
Открытый исходный код
Windows
macOS
Linux
 											Capture2Text — бесплатная утилита оптического распознавания текста с открытым исходным кодом для Windows, позволяющая быстро извлекать текст из выбранных областей экрана с помощью горячих клавиш; поддерживает распознавание текста на нескольких языках, экспорт в буфер обмена и файл, а также базовые функции автоматизации и настройки зон захвата, что делает её удобным инструментом для извлечения текста из изображений, скриншотов и окон приложений.
						
									 
							
					
					Бесплатно✱
Открытый исходный код
Windows
macOS
Linux
 											gocr — свободная программа оптического распознавания символов (OCR), предназначенная для извлечения текста из растровых изображений; разработанная как простое и кроссплатформенное решение, она поддерживает распознавание печатных символов на различных языках, обрабатывает изображения в форматах PNM и TIFF, реализует алгоритмы сегментации и распознавания символов с возможностью настройки параметров для улучшения точности и интеграции в автоматизированные конвейеры обработки изображений; проект известен своей лёгкостью, открытым исходным кодом и использовался в сочетании с другими инструментами для построения более сложных систем распознавания, хотя уступает современным коммерческим и нейросетевым решениям по точности на сложных макетах.
						
									 
							
					
																ABBYY FineReader — коммерческое программное обеспечение для оптического распознавания текста (OCR) и работы с PDF-документами, разработанное компанией ABBYY; предназначено для преобразования отсканированных изображений, фотографий и PDF-файлов в редактируемые и поисковые форматы с сохранением структуры документа, включая распознавание многоязычных текстов, таблиц и формата страницы, а также предоставляет инструменты для сравнения документов, автоматизации пакетной обработки и интеграции в корпоративные рабочие процессы.
						
									 
							
					
					Бесплатно✱
Открытый исходный код
Windows
macOS
Linux
 											SikuliX — это инструмент автоматизации графического пользовательского интерфейса с открытым исходным кодом, который использует распознавание образов для поиска и взаимодействия с элементами экрана; разработанный как продолжение проекта Sikuli, он позволяет писать скрипты на языке Jython, Java или JavaScript для эмуляции кликов, ввода текста и управления окнами, поддерживает захват и использование скриншотов в качестве шаблонов, интеграцию с другими Java-библиотеками и тестирование приложений, и применяется для автоматизации повторяющихся задач, тестирования GUI и создания макросов в средах, где традиционные инструменты автоматизации на основе API недоступны.
						
									 
							
					
					Бесплатно✱
Windows
macOS
Linux
Android
iOS
 											Soda PDF — коммерческое программное обеспечение для создания, просмотра, редактирования и конвертации PDF-документов, разработанное компанией LULU Software; включает инструменты для объединения и разделения файлов, распознавания текста (OCR), аннотирования, защиты паролем и подписи документов, поддерживает работу с облачными хранилищами и пакетную обработку, доступно в виде настольных приложений для Windows и онлайн-сервиса, ориентировано на пользователей и организации, которым требуется универсальное решение для управления PDF-файлами.
						
									 
							
					
																Kofax OmniPage — коммерческое программное обеспечение для оптического распознавания текста (OCR), разработанное для преобразования бумажных документов, отсканированных изображений и файлов PDF в редактируемые и индексируемые цифровые форматы; поддерживает распознавание множества языков, сохранение структуры документа (включая колонки, таблицы и изображения), интеграцию с рабочими процессами документооборота и пакетную обработку, а также предоставляет инструменты для проверки и корректировки результатов распознавания, экспорт в популярные форматы (Word, Excel, searchable PDF и др.) и автоматизацию задач через скрипты и API.
						
									 
							
					
					Бесплатно✱
Открытый исходный код
Windows
Linux
 											CuneiForm — оптическая система распознавания текста, разработанная компанией Cognitive Technologies; представляет собой программный комплекс для преобразования отсканированных документов и изображений в редактируемый машинный текст с поддержкой множества языков и различных форматов ввода, включая печатный и рукописный текст, обладает функциями распознавания макета страницы, сохранения структуры документа и экспорта в распространённые форматы, применяется в архивировании, автоматизации ввода данных и цифровой обработке документов.
						
									 
							
					
																Amazon Textract — облачный сервис оптического распознавания текста и извлечения структурированных данных, разработанный Amazon Web Services; он автоматически анализирует изображения и PDF-документы для распознавания печатного и рукописного текста, таблиц, форм и ключевых полей, возвращая результаты в машиночитаемых форматах с возможностью интеграции в рабочие процессы и приложениях для автоматизации обработки документов.
						
									 
							
					
																Yandex Vision OCR — сервис оптического распознавания текста, разработанный компанией «Яндекс», предназначенный для извлечения и структурирования текстовой информации из изображений и отсканированных документов; поддерживает распознавание печатного и рукописного текста на нескольких языках, распознавание таблиц и полей форм, автоматическое определение ориентации и сегментацию страниц, обеспечивает интеграцию через API для использования в мобильных приложениях и корпоративных системах, включает механизмы постобработки для коррекции ошибок и привязки результатов к форматам сохранения (например, TXT, PDF, DOCX), а также учитывает требования к конфиденциальности данных и масштабируемости при обработке больших объёмов изображений.
						
									 
							
					
																Google Cloud Vision OCR — это облачный сервис оптического распознавания текста, входящий в набор инструментов Google Cloud Vision, который извлекает текстовую информацию из изображений и сканированных документов с поддержкой множества языков и форматов; система использует методы машинного обучения и нейронных сетей для обнаружения и сегментации текста, распознавания символов, определения структурных элементов (строки, абзацы, блоки) и сопоставления их с геометрией на изображении, обеспечивая высокую точность на разнообразных типах изображений, включая фотографии, отсканированные страницы и сложные макеты, а также предоставляя API для интеграции с приложениями, автоматизации рабочих процессов и последующей обработки результатов (например, индексирования, поиска и анализа).
						
									 
							
					
																Hypatos — программный инструмент для оптического распознавания и интерактивного решения математических выражений и задач, предназначенный для автоматизации ввода, упрощения и проверки вычислений; сочетает распознавание рукописного и печатного текста с алгоритмами символьной алгебры и численного анализа, поддерживает разбор уравнений, упрощение выражений, подстановку значений и пошаговую проверку решений, ориентирован на использование в образовательных платформах, приложениях для заметок и научно-исследовательских рабочих процессах, предлагая API для интеграции с внешними сервисами и инструментами автоматизации.
						
									 
							
					
																FreeOCR — бесплатная программа для оптического распознавания текста (OCR), предназначенная для извлечения текста из отсканированных изображений и PDF-документов; поддерживает различные форматы ввода, многоязычность и интеграцию с Tesseract в качестве движка распознавания, обеспечивает базовые функции предварительной обработки изображений (такие как обрезка и поворот) и экспорт распознанного текста в редактируемые форматы, ориентирована на пользователей, которым требуется простое и доступное решение для конвертации изображений в текст без сложных настроек.
						
									 
							
					
																OCR.space — это онлайн-сервис и API для оптического распознавания текста (OCR), предоставляющий автоматическую конвертацию изображений и PDF-файлов в редактируемый текст с поддержкой множества языков и форматов; платформа предлагает как бесплатный веб-интерфейс, так и платные планы с повышенной точностью, обработкой больших объёмов и дополнительными возможностями (например, распознавание таблиц, настройка предобработки изображений и возвращение результатов в формате JSON), используется для извлечения текста из сканов, фотографий документов и PDF в приложениях автоматизации, индексирования и цифровой архивации.
						
									 
							
					
					Бесплатно✱
Windows
macOS
Linux
 											LEADTOOLS OCR — коммерческая библиотека для оптического распознавания текста, входящая в набор SDK LEADTOOLS и предоставляющая инструменты для извлечения текста из растровых изображений и сканированных документов; поддерживает многоплатформенное внедрение, работу с множеством форматов изображений, распознавание на различных языках, распознавание печатного и рукописного текста, а также функции предварительной обработки изображений (дешумление, выравнивание, коррекция наклона), постобработки (исправление ошибок, анализ макета) и интеграции с документными рабочими процессами и хранилищами данных.
						
									 
							
					
																Readiris — коммерческое программное обеспечение для оптического распознавания текста (OCR), разработанное компанией I.R.I.S. и предназначенное для превращения сканированных документов, изображений и PDF-файлов в редактируемые и индексируемые форматы; поддерживает распознавание на нескольких языках, экспорт в форматы Word, Excel и PDF с возможностью сохранения структуры и форматирования, включает инструменты для пакетной обработки, сжатия и управления документами, а также интеграции с облачными сервисами и рабочими процессами, применимо в офисной и деловой среде для автоматизации ввода данных и цифровизации архивов.
						
									 
							
					
					Бесплатно✱
Открытый исходный код
Windows
macOS
Linux
Android
iOS
 											Tesseract — свободная система оптического распознавания текста (OCR) с открытым исходным кодом, первоначально разработанная компанией Hewlett-Packard в 1985–1995 годах и впоследствии поддерживаемая Google; поддерживает множество языков, предлагает модульную архитектуру для предобработки изображений, сегментации и распознавания символов, использует современные методы машинного обучения и LSTM-сети для повышения точности, поставляется как библиотека с командной строкой и обширными параметрами настройки, применяется в цифровизации документов, архивных проектах и встраиваемых решениях и распространяется под лицензией Apache 2.0.
						
									 
							
					
																Google Drive OCR — встроенная функция сервиса Google Drive для оптического распознавания текста в изображениях и PDF-документах, которая извлекает редактируемый текст и метаданные при загрузке файлов; используется для автоматической индексации содержимого, облегчения поиска по документам и конвертации отсканированных материалов в редактируемые форматы, поддерживает множество языков и интегрируется с другими инструментами Google для совместной работы и хранения.
						
									 
							
					
																OmniPage — коммерческое программное обеспечение для оптического распознавания текста (OCR), разработанное для преобразования отсканированных документов, изображений и PDF-файлов в редактируемые и индексируемые форматы; поддерживает работу с множеством языков, сохраняет структуру оригинальных документов, включая макет, таблицы и шрифты, и предлагает инструменты для пакетной обработки, интеграции с рабочими процессами и конвертации в форматы вроде Microsoft Word, Excel и PDF/A, применяя алгоритмы распознавания символов и постобработки для повышения точности вывода.
						
									 
							
					
																Cloudmersive OCR — облачное программное решение для распознавания текста (OCR), предоставляющее API и SDK для извлечения печатного и рукописного текста из изображений и PDF-документов; продукт поддерживает множество языков, автоматическую предобработку изображений (например, коррекцию ориентации, удаление шума и улучшение контраста) и интеграцию с веб- и мобильными приложениями, ориентирован на масштабируемые сценарии использования в бизнесе и разработке, включая пакетные преобразования, обработку документов с табличными данными и обеспечение высокого уровня точности при различном качестве исходных материалов.
						
									 
							
					
																Transym OCR — коммерческая программа оптического распознавания текста, разработанная компанией Transym Ltd., предназначенная для конвертации отсканированных документов и изображений в редактируемые текстовые форматы; отличается поддержкой множества языков и шрифтов, возможностью обучения словарю и шаблонам для повышения точности распознавания, интеграционными возможностями через API и командную строку, а также наличием функций пред- и постобработки изображений (коррекция наклона, устранение шума) для улучшения качества распознаваемого текста; применяется в бизнес-процессах автоматизации ввода данных, архивации документов и системах управления контентом.
						
									 
							
					
																PDF Candy OCR — это веб‑ и настольный инструмент для оптического распознавания текста, разработанный для преобразования отсканированных изображений и PDF‑документов в редактируемые текстовые форматы; служба поддерживает распознавание нескольких языков, сохраняет исходное форматирование по возможности и предоставляет возможности пакетной обработки, интеграции в набор онлайн‑инструментов для работы с PDF и экспорт в распространённые форматы (например, DOCX, TXT), при этом ориентирована на простоту использования и доступна как бесплатная, так и платная версия с расширенным набором функций.
						
									 
							
					
																SimpleOCR — это программное обеспечение оптического распознавания текста (OCR), предназначенное для преобразования отсканированных изображений и фотографий документов в редактируемый цифровой текст; разработанное с упором на простоту использования, оно поддерживает базовые функции распознавания печатного текста на нескольких языках, предлагает инструменты для предварительной обработки изображений (такие как удаление шума и выпрямление), экспорт распознанного текста в стандартные форматы и интеграцию с офисными приложениями, при этом ориентировано на индивидуальных пользователей и малые организации, которым необходима быстрая и экономичная конвертация бумажных документов в цифровой формат.
						
									 
							
					
																Prizmo — коммерческое приложение для оптического распознавания текста (OCR) и обработки изображений документов, разработанное для macOS и iOS; поддерживает распознавание текста на множестве языков, включает инструменты постобработки для редактирования, экспорта и сохранения результатов в различных форматах (PDF, текстовые файлы), а также функции коррекции перспективы и улучшения качества сканов, применяется для цифровизации бумажных документов, извлечения текста из фотографий и повышения доступности контента.
						
									 
							
					
					Бесплатно✱
Windows
macOS
Android
iOS
 											CamScanner — мобильное приложение для сканирования документов, позволяющее с помощью камеры смартфона или планшета создавать цифровые копии бумажных носителей; предлагает автоматическое кадрирование и коррекцию перспективы, улучшение качества изображений, распознавание текста (OCR), организацию и экспорт файлов в форматы PDF и JPEG, а также функции для совместного доступа, синхронизации между устройствами и базового редактирования, применяемое как частными пользователями, так и в деловой среде.
						
									 
							
					
																Genius Scan — мобильное приложение для сканирования документов, разработанное для быстрого создания качественных цифровых копий с камер смартфонов; поддерживает автоматическое обнаружение границ, коррекцию перспективы и улучшение изображения, позволяет сохранять файлы в форматах PDF и JPEG, объединять страницы в многостраничные документы, применять базовые инструменты для обработки (обрезка, поворот, фильтры) и экспортировать или отправлять документы по электронной почте, в облачные хранилища и в другие приложения; доступно на платформах iOS и Android, имеет как бесплатную базовую версию, так и платные опции с расширенными возможностями управления документами и интеграцией.
						
									 
							
					
																Rossum — система оптического распознавания символов и корректировки текста, разработанная как аналог сервиса a9t9; сочетает методы машинного обучения и эвристических правил для распознавания рукописного и печатного текста, обработки ошибок OCR и преобразования изображений в редактируемые текстовые форматы, поддерживает несколько языков и форматов ввода, ориентирована на интеграцию в рабочие процессы автоматизации документооборота и цифровой архивации, обеспечивая высокую точность распознавания за счёт адаптивных моделей и модулей постобработки.
						
									 
							
					
					Бесплатно✱
Открытый исходный код
Linux
 											OCRFeeder — свободное программное обеспечение для оптического распознавания текста и постобработки документов, разработанное для упрощения сканирования, извлечения и редактирования текстовой информации из изображений и PDF; приложение поддерживает подключение нескольких движков OCR, предоставляет графический интерфейс для распознавания страниц, автоматического разбиения на блоки (текст, изображения), экспорт в различные форматы (включая PDF и ODT) и интеграцию с инструментами распознавания языка и корректировки макета, что делает его удобным решением для конвертации бумажных документов в редактируемые цифровые файлы.
						
									 
							
					
																Mercury OCR — программное обеспечение для оптического распознавания текста, разработанное для преобразования изображений и сканов документов в редактируемый текст с поддержкой множества языков и форматов; функционально аналогично a9t9, включает модули предобработки изображений (коррекция перспективы, уменьшение шума), распознавания символов с использованием гибридных алгоритмов машинного обучения и словарной постобработки для повышения точности, экспорт результатов в текстовые и документные форматы, а также предоставляет инструменты пакетной обработки и интеграции через API для автоматизации рабочих процессов.
						
									 
							
					
																SAP Document Information Extraction — облачное решение для автоматизированного извлечения данных из документов, разработанное компанией SAP; использует комбинацию предобученных моделей машинного обучения и правил для распознавания структуры и семантики различных типов документов (счета, заказы, контракты и т.д.), извлекает ключевые поля, выполняет валидацию и сопоставление с бизнес-объектами в корпоративных приложениях, интегрируется с экосистемой SAP для автоматизации процессов ввода данных, сокращения ручной обработки и повышения точности учета и аналитики.
						
									 
							
					
																Transkribus — платформа и набор инструментов для распознавания, транскрибирования и анализа исторических рукописных и печатных документов с использованием методов машинного обучения, включая сегментацию страниц, распознавание текста (HTR/OCRE) и извлечение метаданных; разработанная для архивов, библиотек и исследователей, система поддерживает обучение пользовательских моделей на примерах, пакетную обработку больших коллекций, совместную работу и экспорт результатов в разнообразные форматы, а также интеграцию с другими цифровыми архивными решениями.
						
									 
							
					
																IronOCR — коммерческая библиотека распознавания текста для платформы .NET, предоставляющая средства оптического распознавания (OCR) для извлечения текста из изображений и PDF-документов; поддерживает работу с разными языками и шрифтами, включает инструменты предварительной и постобработки изображений (коррекция наклона, бинаризация, удаление шума), интеграцию с популярными форматами изображений и потоковой обработкой, а также API для извлечения структурированных данных (таблицы, формы) и настройки точности распознавания в серверных и настольных приложениях.
						
									 
							
					
					Бесплатно✱
Windows
macOS
Linux
 											Asprise OCR — программная библиотека и сервис для оптического распознавания текста, предоставляющий API для извлечения текста из изображений и PDF-документов на множестве языков; поддерживает как локальную интеграцию в настольных и серверных приложениях, так и облачные вызовы, обеспечивает распознавание печатного и рукописного текста, настройку уровней точности и форматов вывода (TXT, PDF с текстовым слоем, XML), а также предоставляет функции предварительной обработки изображений и постобработки для повышения качества распознавания и сохранения структуры документа.
						
									 
							
					
					Бесплатно✱
Открытый исходный код
Windows
macOS
Linux
 											EasyOCR — открытая библиотека оптического распознавания текста на Python, разработанная для извлечения письменной информации из изображений и сканов с поддержкой более ста языков; использует сверточные нейронные сети и рекуррентные слои для сегментации и распознавания символов, обеспечивает простую интеграцию в проекты благодаря интуитивному API, настраиваемым моделям и возможности работы с различными шрифтами и форматами изображений, широко применяется для автоматизации ввода данных, цифровизации документов и предобработки текстовой информации в системах компьютерного зрения.
						
									 
							
					
					Бесплатно✱
Открытый исходный код
Windows
macOS
Linux
 											PaddleOCR — это открытая платформа оптического распознавания текста (OCR), разработанная командой PaddlePaddle в Baidu, представляющая собой набор оптимизированных моделей и инструментов для извлечения текста из изображений, поддерживающая сегментацию текста, распознавание символов и постобработку для множества языков и шрифтов; проект ориентирован на высокую точность и производительность в реальных задачах (сканы, фото, документы), предлагает готовые предобученные модели, гибкие конвейеры обработки и возможности для дообучения и оптимизации под встраиваемые и серверные среды, что делает его популярным решением в исследованиях и промышленном применении OCR.
						
									 
							
					
					Бесплатно✱
Открытый исходный код
 											Tesseract.js — это библиотека на JavaScript, обеспечивающая распознавание текста (OCR) в браузере и на серверной стороне с использованием движка Tesseract OCR; она компилирует оригинальный движок на C/C++ в WebAssembly, предоставляя высокоуровневый API для загрузки изображений, настройки языковых моделей и обработки результатов, поддерживает множество языков и различные форматы ввода, позволяет выполнять асинхронную обработку и распараллеливание задач, часто применяется в веб-приложениях для извлечения текста из изображений, сканов и фотографий без необходимости установки нативного ПО.
						
									 
							
					
					Бесплатно✱
Windows
macOS
Android
iOS
 											Adobe Acrobat OCR — встроенная в семейство приложений Adobe функция оптического распознавания текста, предназначенная для преобразования отсканированных документов и изображений в редактируемые и индексируемые текстовые данные; обеспечивает распознавание многоязычных текстов, сохранение макета и форматирования, поддержку поиска по содержимому PDF, интеграцию с инструментами редактирования и экспорта, а также механизмы обработки пакетных заданий и улучшения качества изображений для повышения точности распознавания.
						
									 
							
					
					Windows
macOS
Linux
Android
iOS
 											Modi — это модель генерации формул и математического текста, разработанная как аналог a9t9, предназначенная для распознавания, интерпретации и синтеза математических выражений в текстовом виде; она сочетает методы глубокого обучения и правил для преобразования изображений с рукописными или печатными уравнениями в семантически корректные LaTeX- или ASCII-представления, поддерживает многозадачность (оптическое распознавание формул, привязка контекста, постобработка для корректности синтаксиса) и ориентирована на интеграцию в образовательные, научные и аналитические приложения, предлагая гибкие API-интерфейсы и механизмы оценки качества распознавания.
						
									 
							
					
																SimpleIndex — это программное обеспечение для массовой индексации и автоматизированной обработки документов, предназначенное для упрощения сканирования, распознавания текста (OCR), извлечения метаданных и загрузки данных в базы данных или системы управления документами; приложение поддерживает работу с большими объёмами файлов, настраиваемые рабочие процессы и шаблоны извлечения полей для ускорения цифровой оцифровки, категоризации и поиска документов в корпоративных и мелкобизнесовых средах.
						
									 
							
					
					Бесплатно✱
Открытый исходный код
Windows
macOS
Linux
 											Calamari OCR — это открытая система оптического распознавания текста, основанная на современных методах глубокого обучения и предназначенная для конвертации изображений рукописного и печатного текста в машинно-читаемый формат; проект поддерживает обучение и гибкую настройку моделей на пользовательских наборах данных, использует последовательные сверточно-рекуррентные архитектуры и методы трансферного обучения для повышения точности распознавания, обеспечивает поддержку множества шрифтов и языков, интеграцию с рабочими процессами для пакетной обработки документов и активно применяется в научных, архивных и цифровизационных проектах.
						
									 
							
					
																Prizmo Go — мобильное приложение для оптического распознавания текста (OCR), разработанное для быстрого захвата и преобразования печатного и рукописного текста с помощью камеры смартфона; приложение поддерживает множество языков, автоматически выравнивает и обрезает изображения, предлагает функции редактирования распознанного текста и экспорта в форматы TXT и PDF, а также включает встроенные средства для озвучивания текста (TTS) и интеграцию с буфером обмена и облачными сервисами, что делает его удобным инструментом для сканирования документов, извлечения текста из книг и заметок и последующего использования на мобильных устройствах.
						
									 
							
					
					Бесплатно✱
Открытый исходный код
Windows
macOS
Linux
 											gImageReader — свободная программа с графическим интерфейсом для движка OCR Tesseract, предназначенная для распознавания текста на изображениях и в PDF-документах; поддерживает пакетную обработку, предварительную обработку изображений (включая поворот, кадрирование и коррекцию контраста), редактирование и экспорт распознанного текста в различные форматы, многоязычный интерфейс и возможность настройки параметров распознавания, что делает её удобным инструментом для извлечения текста из сканов и фотографий в средах Linux и Windows.
						
									 
							
					
																Nanonets — это облачная платформа на базе машинного обучения, специализирующаяся на автоматизации извлечения данных из документов и изображений с помощью моделей оптического распознавания символов (OCR) и сегментации; сервис предоставляет инструменты для обучения пользовательских моделей через загрузку примеров, поддерживает интеграцию с бизнес-процессами через API и коннекторы, ориентирован на обработку счётов, форм, накладных и других структурированных и полуструктурированных документов, обеспечивает масштабируемость, настройку под конкретные шаблоны и экспорт данных в стандартных форматах для дальнейшей автоматизированной обработки.
						
									 
							
					
					Бесплатно✱
Открытый исходный код
Windows
macOS
Linux
 											OCRmyPDF — свободная программа с открытым исходным кодом для распознавания текста в PDF-документах, добавляющая слой с распознанным текстом поверх изображений страниц без изменения исходного визуального представления; поддерживает пакетную обработку, автоматическое выравнивание и коррекцию ориентации, интеграцию с движками OCR (например, Tesseract), сохранение результатов в стандартизированном PDF/A для долгосрочного архива и предоставляет опции управления качеством распознавания и метаданными, применима для оцифровки архивных материалов, подготовки поиско-индексируемых документов и улучшения доступности.
						
									 
							
					
																Scanbot — мобильное приложение для сканирования документов и обработки изображений, разработанное для быстрого оцифровывания бумажных носителей с помощью камеры смартфона; предоставляет функции автоматического кадрирования и выравнивания, оптического распознавания текста (OCR), сохранения в формате PDF и изображений, организацию и поиск документов, а также интеграцию с облачными хранилищами и возможность защиты файлов паролем, ориентировано на удобство использования как частными пользователями, так и профессионалами для упрощения рабочих процессов по архивированию и обмену документами.
						
									 
							
					
																i2OCR — это бесплатный веб‑сервис для оптического распознавания текста (OCR), позволяющий извлекать текст из растровых изображений и PDF‑файлов на множестве языков; инструмент поддерживает загрузку файлов с компьютера и по URL, предлагает автоматическое определение языка и базовую постобработку результата, включая сохранение в формате TXT, DOCX и копирование в буфер обмена, при этом не требует установки программного обеспечения и ориентирован на простое и быстрое извлечение машинно‑читаемого текста для последующего редактирования и поиска.
						
									 
							
					
																OnlineOCR.net — веб‑сервис для оптического распознавания текста (OCR), предоставляющий пользователям возможность преобразовывать отсканированные изображения и PDF‑документы в редактируемые форматы, такие как Microsoft Word, Excel и простой текст; поддерживает множество языков, распознавание таблиц и пакетную обработку файлов, действует через простой веб‑интерфейс без необходимости установки локального ПО и используется для извлечения текста из изображений, архивирования документов и повышения доступности бумажных материалов в цифровых рабочих процессах.
						
									 
							
					
																PaperScan — программное обеспечение для оптического распознавания текста (OCR) и управления сканированными изображениями, предоставляющее инструменты для захвата, обработки и конвертации бумажных документов в редактируемые и индексируемые форматы; поддерживает работу с различными сканерами и многослойными изображениями, включает функции автоматической коррекции изображений, пакетной обработки, распознавания на нескольких языках и экспорт в форматы PDF, DOCX и другие, ориентировано на упрощение цифровизации документов для последующего поиска, хранения и редактирования.
						
									 
							
					
					Бесплатно✱
Открытый исходный код
Windows
macOS
Linux
 											NAPS2 (Not Another PDF Scanner 2) — бесплатная и открытая программа для сканирования документов, поддерживающая множество сканеров через драйверы TWAIN и WIA; предоставляет удобный интерфейс для создания многостраничных PDF, TIFF и других форматов, включает функции предварительного просмотра, обрезки, поворота, обработки изображений (коррекция контраста и яркости, удаление шума), оптического распознавания текста (OCR) через внешние движки и параметры пакетной обработки, ориентирована на простое и быстрое оцифровывание документов как для частных пользователей, так и для небольших организаций.