OCI Data Science — это управляемая облачная платформа от Oracle, предназначенная для разработки, обучения и развёртывания моделей машинного обучения. Платформа предоставляет интерактивные рабочие среды, инструменты для подготовки данных, масштабируемые вычислительные ресурсы и средства интеграции с популярными open‑source фреймворками, что позволяет организовать полный цикл работы дата‑сайентистов и команд машинного обучения.
Исторически OCI Data Science развивалась как компонент облачной экосистемы Oracle, ориентированный на корпоративные потребности в ML‑разработке и операционализации моделей. Решение объединяет среду на базе JupyterLab, управление вычислительными кластерами и GPU‑инстансами, функциональность для автоматизации конвейеров и средства мониторинга развернутых моделей. При ограниченности общедоступных деталей о внутренних реализациях, общая функциональность может быть описана на основе типичных возможностей платформ такого класса и официальных описаний производителя.
- Интерактивные среды: управляемые JupyterLab‑окружения с предустановленными библиотеками для анализа данных и обучения моделей.
- Масштабируемое обучение: поддержка распределённого обучения и выделения вычислительных ресурсов, включая GPU‑инстансы для ускорения обучения нейронных сетей.
- Интеграция с open‑source: совместимость с популярными фреймворками (например, TensorFlow, PyTorch, scikit‑learn) и инструментами для работы с данными.
- MLOps и деплоймент: средства для развёртывания моделей в продуктиве, управления версиями артефактов модели и настройки процессов CI/CD для ML.
- Конвейеры и автоматизация: поддержка построения конвейеров обработки данных и обучения моделей для повторяемых и автоматизированных рабочих процессов.
- Мониторинг и управление: возможности мониторинга производительности моделей, логирования и отслеживания метрик после развёртывания.
- Безопасность и управление доступом: интеграция с механиками контроля доступа и управления идентификацией в облачной среде для разграничения прав команд и пользователей.
- Хранение и доступ к данным: интеграция с облачными сервисами хранения и системами управления данными для подготовки наборов данных и репликации.
- Поддержка командной работы: инструменты для совместной разработки, совместного использования окружений и управления артефактами проектов.