Google Document AI — это облачный сервис для извлечения, структурирования и анализа данных из разнообразных документов с использованием методов оптического распознавания символов (OCR) и моделей машинного обучения. Сервис ориентирован на автоматизацию обработки документов в корпоративных рабочих процессах, включая сканированные изображения, отсканированные файлы PDF и цифровые формы. Document AI предлагает набор преднастроенных и настраиваемых конвейеров обработки для распознавания текста, сегментации макета страницы, определения языков и привязки извлечённых значений к семантическим сущностям.
Платформа развивается как часть экосистемы инструментов для облачных вычислений и машинного обучения и интегрируется с другими сервисами для хранения, управления и дальнейшего анализа данных. Основные применения включают автоматическую обработку счетов, форм, договоров и идентификационных документов, где требуется извлечение ключевых полей, проверка соответствия формальным требованиям и приведение данных к машинно-обрабатываемому формату. Document AI поддерживает настройку под отраслевые сценарии и предоставляет механизмы обучения и дообучения моделей на примерах заказчика.
- Оптическое распознавание текста (OCR): извлечение символов и слов с изображений и PDF с сохранением структуры страницы.
 - Анализ макета страницы: определение блоков текста, таблиц, заголовков и других структурных элементов.
 - Извлечение сущностей: распознавание и классификация ключевых полей и данных (имена, даты, суммы, реквизиты и т.п.).
 - Парсинг форм и счетов: специализированные конвейеры для обработки типовых документов с сопоставлением полей и шаблонов.
 - Классификация документов: автоматическое распределение документов по типам и категориям для маршрутизации и дальнейшей обработки.
 - Настраиваемые модели: возможность дообучения и настройки распознавания под специфические шаблоны и терминологии заказчика.
 - Интеграция и масштабируемость: API для встраивания в бизнес-приложения и конвейеры обработки с поддержкой пакетной и потоковой обработки.
 - Экспорт структурированных данных: вывод в машиночитаемых форматах для последующей аналитики, учёта и хранения.