Copyfish — это браузерное расширение с функцией оптического распознавания текста (OCR), предназначенное для извлечения, копирования и перевода текста, находящегося в изображениях, видео или PDF-документах. Расширение доступно для популярных браузеров, таких как Chrome, Firefox и Edge, и распространяется под открытой лицензией. Несмотря на это, в публичных источниках имеются лишь ограниченные сведения о внутренней архитектуре и истории проекта.
Целью Copyfish является предоставление пользователю возможности работать с текстом из визуального содержания — например, субтитров видео, надписей на картинках, сканов документов — так же просто, как с обычным текстом в веб-страницах. Приложение поддерживает многоязычное распознавание и обеспечивает встроенные опции перевода извлечённого текста. Поскольку официальных исторических обзоров немного, часть описания базируется на опубликованных пользовательских руководствах и технических спецификациях расширения.
- Выделение области на изображении, видео или PDF для распознавания текста
- Отображение результата OCR в виде наложенного текста поверх исходного изображения (overlay) для быстрой проверки
- Копирование распознанного текста в буфер обмена
- Перевод извлечённого текста с использованием внешних переводчиков (например, Google Translate или DeepL)
- Многократный повтор распознавания одной и той же области (например, для субтитров в видео)
- Поддержка drag-and-drop локальных изображений и PDF в браузере
- Выбор и переключение между несколькими OCR-движками / языками распознавания
- Поддержка «desktop OCR» через дополнительный модуль (XModule), что позволяет захватывать текст с экрана вне браузера
- Работа с данными конфиденциальности: при облачном OCR изображения отправляются на сервер для обработки (без долгосрочного хранения данных), а локальная OCR-опция обрабатывается полностью на устройстве