Pic2Text — это инструмент оптического распознавания символов (OCR, от английского Optical Character Recognition), предназначенный для извлечения текста из изображений, фотоснимков, скриншотов и отсканированных документов. Он преобразует визуальный контент в редактируемый машинный текст, сохраняя структуру исходного материала, насколько это возможно. Назначение Pic2Text заключается в упрощении процесса перевода бумажной или графической информации в цифровую форму с возможностью дальнейшего редактирования, поиска и анализа.
Проект Pic2Text (иногда пишут как Pix2Text или P2T) развивался как открытое решение, сопоставимое с коммерческими системами вроде Mathpix, с акцентом на распознавание не только обычного текста, но и математических формул, таблиц и структурированного макета страницы. В официальной версии поддерживается более восьмидесяти языков, при этом для английского и упрощённого китайского используются одни модели распознавания, а для остальных языков — альтернативные. Pic2Text доступен как локальное приложение и как онлайн-сервис, с определёнными ограничениями на объём распознавания в бесплатном режиме.
- Распознавание чистого текста — преобразование изображения с набором символов в строковый текст с учётом порядка строк и блоков.
 - Математическая формула и её распознавание — обнаружение формул на изображении и преобразование их в формат LaTeX или аналогичный текстовый формат.
 - Анализ макета — выявление разделов, колонок, блоков текста, изображений, таблиц и восстановление структурной разметки.
 - Распознавание таблиц — извлечение табличных данных из изображений с сохранением ячеек и структуры.
 - Поддержка многоязычности — обеспечение работы с десятками языков, включая европейские, китайские и др.
 - Экспорт в Markdown — преобразование распознанного содержимого в формат Markdown с учётом формул и структуры.
 - Поддержка PDF — конвертация отсканированных PDF-документов или их страниц в текст или Markdown.
 - Онлайн- и офлайн-режимы работы — возможность локального запуска без интернета, а также использование веб-сервиса с ограничениями на бесплатный доступ.