VMware Tanzu Greenplum

Linux

Сайт: greenplum.org

VMware Tanzu Greenplum — коммерческая распределённая аналитическая система управления базами данных (СУБД) класса MPP, развиваемая VMware в рамках семейства продуктов Tanzu. Система основана на ядре PostgreSQL и ориентирована на хранение и обработку больших объёмов данных для хранилищ данных (data warehouse) и аналитических рабочих нагрузок. В архитектуре реализована масштабируемая партиционированная обработка запросов с параллельным выполнением на множестве сегментных узлов, что позволяет обеспечивать высокую пропускную способность при аналитических операциях и агрегировании.

Исторически Greenplum зародилась как проект с собственной историей развития, затем прошла через несколько этапов коммерческих продуктов и приобретений; текущая коммерческая версия интегрируется разработчиками и распространяется под брендом VMware Tanzu. Продукт сочетает возможности реляционной СУБД, расширенные аналитические функции и инструменты для выполнения вычислений внутри базы данных, включая расширения для in-database машинного обучения и обработки массивных наборов данных. Поддерживается развёртывание в виртуализированных и облачных средах, в том числе в контейнерных кластерах, что соответствует позиционированию в портфеле Tanzu.

  • Архитектура MPP: распределённая модель с мастером и множеством сегментных узлов для параллельной обработки запросов и масштабирования по горизонтали.
  • Основано на PostgreSQL: совместимость с синтаксисом и расширениями PostgreSQL, возможность использования стандартных инструментов экосистемы.
  • In-database ML и аналитика: встроенные или интегрируемые расширения для выполнения задач машинного обучения непосредственно в СУБД без выгрузки данных.
  • Оптимизатор выполнения запросов: планировщик и оптимизатор, рассчитанные на обработку больших аналитических запросов с учётом распределённых ресурсов.
  • Хранение и компоновка данных: поддержка разбиения по диапазонам и хешу, колоночных и строковых форматов хранения для оптимизации аналитики.
  • Интеграция с экосистемой: совместимость с ETL/ELT-инструментами, BI-платформами и средствами управления данными для построения аналитических конвейеров.
  • Администрирование и мониторинг: средства для управления кластерами, балансировки нагрузки, резервного копирования и мониторинга производительности.
  • Безопасность и контроль доступа: механизмы аутентификации, авторизации, шифрования и аудита для соответствия корпоративным требованиям.
  • Гибкость развёртывания: поддержка локальных, виртуализированных и облачных установок, включая контейнерные среды и интеграцию с инструментами управления инфраструктурой.
  • Коммерческая поддержка: поставляется с коммерческими подписками и поддержкой в рамках предложений VMware для корпоративных клиентов.
Подробнее