Copyfish

Бесплатно
Открытый исходный код
Windows
macOS
Linux

Сайт: ocr.space/copyfish

Copyfish — это браузерное расширение с функцией оптического распознавания текста (OCR), предназначенное для извлечения, копирования и перевода текста, находящегося в изображениях, видео или PDF-документах. Расширение доступно для популярных браузеров, таких как Chrome, Firefox и Edge, и распространяется под открытой лицензией. Несмотря на это, в публичных источниках имеются лишь ограниченные сведения о внутренней архитектуре и истории проекта.

Целью Copyfish является предоставление пользователю возможности работать с текстом из визуального содержания — например, субтитров видео, надписей на картинках, сканов документов — так же просто, как с обычным текстом в веб-страницах. Приложение поддерживает многоязычное распознавание и обеспечивает встроенные опции перевода извлечённого текста. Поскольку официальных исторических обзоров немного, часть описания базируется на опубликованных пользовательских руководствах и технических спецификациях расширения.

  • Выделение области на изображении, видео или PDF для распознавания текста
  • Отображение результата OCR в виде наложенного текста поверх исходного изображения (overlay) для быстрой проверки
  • Копирование распознанного текста в буфер обмена
  • Перевод извлечённого текста с использованием внешних переводчиков (например, Google Translate или DeepL)
  • Многократный повтор распознавания одной и той же области (например, для субтитров в видео)
  • Поддержка drag-and-drop локальных изображений и PDF в браузере
  • Выбор и переключение между несколькими OCR-движками / языками распознавания
  • Поддержка «desktop OCR» через дополнительный модуль (XModule), что позволяет захватывать текст с экрана вне браузера
  • Работа с данными конфиденциальности: при облачном OCR изображения отправляются на сервер для обработки (без долгосрочного хранения данных), а локальная OCR-опция обрабатывается полностью на устройстве
Подробнее