Copyfish

Copyfish — это браузерное расширение с функцией оптического распознавания текста (OCR), предназначенное для извлечения, копирования и перевода текста, находящегося в изображениях, видео или PDF-документах. Расширение доступно для популярных браузеров, таких как Chrome, Firefox и Edge, и распространяется под открытой лицензией. Несмотря на это, в публичных источниках имеются лишь ограниченные сведения о внутренней архитектуре и истории проекта.

Целью Copyfish является предоставление пользователю возможности работать с текстом из визуального содержания — например, субтитров видео, надписей на картинках, сканов документов — так же просто, как с обычным текстом в веб-страницах. Приложение поддерживает многоязычное распознавание и обеспечивает встроенные опции перевода извлечённого текста. Поскольку официальных исторических обзоров немного, часть описания базируется на опубликованных пользовательских руководствах и технических спецификациях расширения.

Выделение области на изображении, видео или PDF для распознавания текста
Отображение результата OCR в виде наложенного текста поверх исходного изображения (overlay) для быстрой проверки
Копирование распознанного текста в буфер обмена
Перевод извлечённого текста с использованием внешних переводчиков (например, Google Translate или DeepL)
Многократный повтор распознавания одной и той же области (например, для субтитров в видео)
Поддержка drag-and-drop локальных изображений и PDF в браузере
Выбор и переключение между несколькими OCR-движками / языками распознавания
Поддержка «desktop OCR» через дополнительный модуль (XModule), что позволяет захватывать текст с экрана вне браузера
Работа с данными конфиденциальности: при облачном OCR изображения отправляются на сервер для обработки (без долгосрочного хранения данных), а локальная OCR-опция обрабатывается полностью на устройстве