SAS Enterprise Miner

Windows
Linux

Сайт: www.sas.com/en_us/software/enterprise-miner.html

SAS Enterprise Miner — коммерческая платформа для построения, оценки и развёртывания статистических, прогнозных и описательных моделей данных. Продукт предоставляет среду с визуальным интерфейсом, где аналитики и дата-саентисты могут проектировать потоки обработки данных, экспериментировать с методами подготовки признаков, выбирать и настраивать алгоритмы машинного обучения, а также сравнивать результаты моделей по метрикам качества. Программный продукт интегрируется с другими компонентами экосистемы SAS и ориентирован на корпоративное применение в задачах кредитного скоринга, маркетинга, управления рисками и операционного анализа.

Исторически решение развивалось как часть пакета аналитических инструментов SAS Institute и включало множество готовых модулей для обработки данных, визуальной разработки модели и автоматизации рабочих процессов. Интерфейс основан на концепции потоков работ (diagram flow), которые объединяют этапы загрузки и очистки данных, преобразования признаков, отбора переменных, обучения алгоритмов (включая деревья решений, регрессии, ансамбли, нейронные сети и методы стохастической оптимизации) и постобработки результатов. Платформа поддерживает масштабирование на серверных конфигурациях и использование встроенных процедур для интерпретации моделей и оценки стабильности.

  • Визуальное проектирование потоков: создание и управление последовательностью шагов подготовки данных и моделирования с помощью блоков и соединительных линий.
  • Подготовка и очистка данных: средства для обработки пропусков, трансформации переменных, биннинга и кодирования категориальных признаков.
  • Выбор и инженерия признаков: автоматизированные и ручные инструменты для отбора релевантных переменных, генерации взаимодействий и создания производных признаков.
  • Алгоритмы обучения: реализация широкого набора методов: логистическая и линейная регрессия, решающие деревья, бустинг, случайный лес, нейронные сети и другие.
  • Оценка и валидация моделей: расчет метрик качества, перекрёстная проверка, анализ ROC/AUC, матрицы ошибок и сравнительный анализ нескольких моделей.
  • Интерпретируемость и диагностика: инструменты для оценки важности признаков, визуализации структур деревьев, частичных зависимостей и стабильности моделей во времени.
  • Автоматизация и повторяемость: возможность сохранять потоки работ, параметризовать процессы и воспроизводить эксперименты для промышленного использования.
  • Интеграция и развёртывание: экспорт моделей и скриптов для интеграции в производственные системы, поддержка форматов и интерфейсов корпоративных хранилищ данных.
  • Масштабирование и производительность: использование серверных ресурсов SAS, параллельной обработки и оптимизированных процедур для работы с большими наборами данных.
  • Отчётность и экспорт результатов: функции формирования сводных отчётов по сессиям моделирования и экспорта результатов в табличные форматы.
Подробнее