Vertica — это колоночная аналитическая система управления базами данных, разработанная для хранения и быстрого выполнения сложных аналитических запросов над большими объёмами данных. СУБД ориентирована на аналитические нагрузки (OLAP), использует колоночное хранение данных, сжатие и векторизованную обработку для повышения пропускной способности запросов. Архитектура поддерживает массово-параллельную обработку (MPP) и масштабирование по горизонтали, что позволяет распределять данные и вычисления между множеством узлов кластера.
Платформа изначально разрабатывалась для задач анализа журналов и телекоммуникационных данных, затем получила широкое применение в бизнес-аналитике, аналитике поведения пользователей, мониторинге и обработке событий в реальном времени. Vertica предоставляет возможности интеграции с облачными окружениями и популярными инструментами экосистемы данных, а также включает встроенные аналитические функции и расширения для машинного обучения, позволяющие выполнять обогащение данных и предварительную подготовку признаков непосредственно в базе данных.
- Колоночное хранение: данные организованы по столбцам для эффективного сжатия и быстрого доступа при агрегациях и сканировании больших объёмов.
 - MPP-архитектура: масштабирование по горизонтали с распределением данных и вычислений между узлами для повышения производительности.
 - Сжатие и кодирование: множество алгоритмов сжатия и методов кодирования, уменьшающих объём хранения и ускоряющих ввод-вывод.
 - Векторизованная обработка: выполнение операций над наборами значений для повышения эффективности процессорных вычислений.
 - Поддержка SQL: полнофункциональная поддержка SQL для аналитических запросов, агрегаций и оконных функций.
 - Встроенные аналитические функции: набор функций для статистики, временных рядов, геопространственной аналитики и базовых ML-операций.
 - Интеграция с облаками: развёртывание в публичных облаках и гибридных средах, совместимость с объектным хранилищем для долговременного хранения данных.
 - Высокая доступность и восстановление: механизмы репликации, балансировки и восстановления для обеспечения непрерывной работы кластера.
 - Оптимизация запросов и планировщик: планирование выполнения с учётом распределённых данных, статистики и стоимости операций.
 - Безопасность и управление доступом: средства аутентификации, авторизации и шифрование данных в покое и при передаче.
 - Инструменты загрузки и коннекторы: поддержка массовых загрузок данных, потоковой загрузки и подключений к ETL/BI-инструментам.
 - Управляемость и мониторинг: средства администрирования, мониторинга производительности и управления ресурсами кластера.