Sensu — это система мониторинга с открытым исходным кодом, предназначенная для наблюдения за инфраструктурой, приложениями и сервисами в распределённых и облачных средах. Платформа реализует модель проверки состояния через агентскую архитектуру и серверные компоненты, обеспечивая сбор телеметрии, выполнение проверок, агрегацию событий и маршрутизацию оповещений. Sensu рассчитан на работу в динамических средах, таких как контейнерные кластеры и гибридные облачные инсталляции, где уровень автоматизации и масштабируемости является ключевым требованием.
Проект возник как средство объединения классических проверок состояния (health checks) и современных подходов к наблюдаемости, включая интеграцию с системами метрик, логирования и автоматизации инцидентов. Sensu поддерживает расширяемую систему плагинов и обработчиков, что позволяет адаптировать платформу под различные сценарии: от простых проверок доступности до комплексного анализа метрик и автоматического реагирования на события. История проекта включает развитие от локальных агентских установок к облачно-ориентированной архитектуре с акцентом на безопасность и масштабируемость.
- Архитектура: агент-сервер с возможностью горизонтального масштабирования и распределённого развёртывания в гибридных и облачных средах.
 - Проверки и расширения: поддержка пользовательских плагинов для проверки состояния, сбора метрик и выполнения диагностических задач.
 - Обработка событий: маршрутизация, фильтрация и корреляция событий с последующей передачей в внешние системы оповещений и управления инцидентами.
 - Интеграции: совместимость с инструментами визуализации и хранения метрик, системами логирования и платформами оповещений посредством подключаемых обработчиков.
 - Управление конфигурацией: декларативный подход к описанию проверок и обработчиков, возможность централизованного управления политиками и шаблонами.
 - Безопасность: механизмы аутентификации и шифрования каналов связи между компонентами для защиты данных мониторинга.
 - Масштабируемость и устойчивость: поддержка кластерных развёртываний, балансировки нагрузки и отказоустойчивых конфигураций.
 - Автоматизация реагирования: возможности для автоматического выполнения действий в ответ на события, включая автозакрытие инцидентов и вызов внешних скриптов.