SAS Enterprise Miner — коммерческая платформа для построения, оценки и развёртывания статистических, прогнозных и описательных моделей данных. Продукт предоставляет среду с визуальным интерфейсом, где аналитики и дата-саентисты могут проектировать потоки обработки данных, экспериментировать с методами подготовки признаков, выбирать и настраивать алгоритмы машинного обучения, а также сравнивать результаты моделей по метрикам качества. Программный продукт интегрируется с другими компонентами экосистемы SAS и ориентирован на корпоративное применение в задачах кредитного скоринга, маркетинга, управления рисками и операционного анализа.
Исторически решение развивалось как часть пакета аналитических инструментов SAS Institute и включало множество готовых модулей для обработки данных, визуальной разработки модели и автоматизации рабочих процессов. Интерфейс основан на концепции потоков работ (diagram flow), которые объединяют этапы загрузки и очистки данных, преобразования признаков, отбора переменных, обучения алгоритмов (включая деревья решений, регрессии, ансамбли, нейронные сети и методы стохастической оптимизации) и постобработки результатов. Платформа поддерживает масштабирование на серверных конфигурациях и использование встроенных процедур для интерпретации моделей и оценки стабильности.
- Визуальное проектирование потоков: создание и управление последовательностью шагов подготовки данных и моделирования с помощью блоков и соединительных линий.
 - Подготовка и очистка данных: средства для обработки пропусков, трансформации переменных, биннинга и кодирования категориальных признаков.
 - Выбор и инженерия признаков: автоматизированные и ручные инструменты для отбора релевантных переменных, генерации взаимодействий и создания производных признаков.
 - Алгоритмы обучения: реализация широкого набора методов: логистическая и линейная регрессия, решающие деревья, бустинг, случайный лес, нейронные сети и другие.
 - Оценка и валидация моделей: расчет метрик качества, перекрёстная проверка, анализ ROC/AUC, матрицы ошибок и сравнительный анализ нескольких моделей.
 - Интерпретируемость и диагностика: инструменты для оценки важности признаков, визуализации структур деревьев, частичных зависимостей и стабильности моделей во времени.
 - Автоматизация и повторяемость: возможность сохранять потоки работ, параметризовать процессы и воспроизводить эксперименты для промышленного использования.
 - Интеграция и развёртывание: экспорт моделей и скриптов для интеграции в производственные системы, поддержка форматов и интерфейсов корпоративных хранилищ данных.
 - Масштабирование и производительность: использование серверных ресурсов SAS, параллельной обработки и оптимизированных процедур для работы с большими наборами данных.
 - Отчётность и экспорт результатов: функции формирования сводных отчётов по сессиям моделирования и экспорта результатов в табличные форматы.