Cloud Bigtable — это управляемый распределённый сервис баз данных, реализующий модель wide-column и ключ-значение, предназначенный для хранения и обработки больших объёмов данных с низкой задержкой и высокой пропускной способностью. Сервис обеспечивает горизонтальное масштабирование и следит за инфраструктурой, распределением данных и отказоустойчивостью, позволяя пользователям фокусироваться на моделировании данных и приложениях. Архитектурно база опирается на концепции распределённого хранилища с разбиением данных по регионам и хранением в столбцово-ориентированном формате для эффективной работы с временными рядами, метриками и аналитическими нагрузками.
Типичные сценарии использования включают обработку событийных потоков, хранение и агрегацию телеметрии, аналитические запросы по большим таблицам и поддержку OLTP- и OLAP-подобных нагрузок в гибридных архитектурах. Сервис предоставляет интерфейсы для программного доступа через клиентские библиотеки и совместимость с экосистемой инструментов для обработки данных. Управляемые функции охватывают автоматическое резервирование, мониторинг производительности и управление версиями данных, при этом пользователю доступны конфигурации для балансировки стоимости и производительности.
- Модель данных: wide-column и key-value, столбцово-ориентированное хранение с возможностью версионирования ячеек.
- Масштабирование: горизонтальное шардирование с автоматическим перераспределением регионов для обеспечения высокой пропускной способности.
- Низкая задержка: оптимизировано для быстрых операций чтения и записи при больших объёмах данных.
- Отказоустойчивость: распределённое хранение и репликация данных для минимизации простоя и потерь данных.
- Управление: полностью управляемый сервис с автообслуживанием инфраструктуры, бэкапами и мониторингом.
- Интеграция: клиентские библиотеки и API для интеграции с аналитическими и потоковыми системами.
- Производительность: конфигурируемые уровни производительности и SLA для чтения/записи.
- Безопасность: механизмы аутентификации и контроля доступа на уровне сервиса и сети.
- Использование ресурсов: оптимизация хранения для больших объёмов табличных данных и временных рядов.
- Применимость: подходяща для телеметрии, интернет-вещей, рекламы в реальном времени, аналитики больших данных и служебных метрик.