Smallpdf OCR — веб‑сервис для оптического распознавания текста, входящий в набор онлайн-инструментов Smallpdf. Он предназначен для преобразования отсканированных документов и изображений в PDF или других форматах в машинно-распознаваемый и при необходимости редактируемый текст. Инструмент реализует типичные функции OCR, включая определение ориентации страницы, обработку многостраничных файлов и выбор языка распознавания, и интегрируется с общими рабочими процессами работы с PDF, такими как сжатие, конвертация и объединение файлов.
Исторические и технические сведения о конкретной реализации Smallpdf OCR могут быть ограничены в общедоступных источниках; в тексте приведено описание функциональности, типичных для данного класса сервисов. Smallpdf как платформа развивалась как набор облачных утилит для работы с PDF, и компонент OCR дополняет набор механизмов для превращения растровых страниц в текстовые слои, пригодные для поиска и копирования. В зависимости от версии сервиса, обработка может выполняться на сервере в облаке, с поддержкой нескольких языков и базовой постобработки результата для улучшения точности.
- Распознавание текста: преобразование изображений и отсканированных страниц в машинный текст с формированием текстового слоя в PDF.
- Многоязычность: поддержка распознавания на нескольких языках и возможность выбора языка для улучшения точности.
- Обработка многостраничных документов: возможность работать с многостраничными PDF и изображениями, сохраняя структуру документа.
- Сохранение формата: попытки сохранить макет страницы, включая абзацы и базовое позиционирование текста относительно изображения.
- Экспорт и совместимость: экспорт результатов в редактируемые форматы или создание поискового PDF, совместимого с большинством читалок и редакторов.
- Интеграция с рабочими процессами: сочетание с функциями конвертации, сжатия и объединения PDF в рамках единой веб‑платформы.
- Параметры качества обработки: автоматическая и ручная коррекция ориентации и базовая фильтрация шума для повышения качества распознавания.
- Конфиденциальность и хранение: модель хранения и обработки файлов зависит от политики поставщика; в общедоступных описаниях указываются временные серверные обработки и удаление загруженных файлов по истечении заданного периода.