DataStax Enterprise (DSE) — это коммерческая распределённая NoSQL СУБД, построенная на базе Apache Cassandra и предназначенная для корпоративных сценариев с высокими требованиями к масштабируемости, доступности и низкой латентности. Она интегрирует дополнительные компоненты — такие как аналитика, поиск и графовые возможности — в единый стек, облегчая эксплуатацию гибридных кластеров и глобально распределённых систем. Многие функции DSE ориентированы на применение в критичных производственных средах, где требуется отказоустойчивость, безопасность и процессный контроль.
Исторически DataStax началась как компания, фокусирующаяся на развитии Cassandra-экосистемы и предложении её коммерческой версии с расширениями. Со временем DSE эволюционировала, дополняясь модулями анализа данных, индексирования, графового хранилища и инструментами администрирования. Несмотря на то, что основная часть архитектуры наследуя особенности Apache Cassandra, DSE вводит собственные улучшения, ориентированные на потребности крупных организаций. Однако подробная внутренняя документация многих компонентов является проприетарной.
- Многомодельность: поддержка широких колонок (Cassandra), документов, графов и полнотекстового поиска.
- Интеграция аналитики: встроенная поддержка обработки больших данных и аналитики (на основе Spark-компонентов).
- Масштабируемость и отказоустойчивость: линейное масштабирование кластеров без простоев и автоматическое распределение нагрузки.
- Глобальное распространение данных: географически распределённые кластеры с локальными копиями данных для низкой задержки.
- Управление нагрузками (workload isolation): возможность запуска разных типов нагрузок (транзакционные, аналитические, поисковые) внутри одного кластера или на узлах с разделением ролей.
- Безопасность и контроль доступа: встроенная аутентификация, разграничение ролей, шифрование данных «на месте» и «в движении».
- Мониторинг и управление: инструменты визуализации, предупреждений, резервного копирования и автоматического восстановления.
- Инструменты для разработчиков: поддержка языка запросов CQL, драйверов, утилит миграции и среды запросов.
- Гибридные и многооблачные развёртывания: поддержка как он-премис, так и облачных сред, в том числе смешанных инфраструктур.
- Непрерывная доступность: архитектура без единой точки отказа, автоматическое восстановление и репликация данных.