Elasticsearch

Бесплатно
Открытый исходный код
Windows
macOS
Linux

Сайт: www.elastic.co/elasticsearch

Elasticsearch — распределённая поисковая и аналитическая платформа, разработанная для индексации, поиска и анализа больших объёмов структурированных и неструктурированных данных в режиме реального времени. Базируясь на библиотеке Apache Lucene, система предоставляет возможности полнотекстового поиска, ранжирования документов, агрегирования данных и обработки запросов через HTTP/JSON API. Архитектура Elasticsearch ориентирована на масштабируемость и отказоустойчивость: данные разбиваются на шарды и реплики, что обеспечивает горизонтальное масштабирование и высокую доступность.

Первоначально созданная как движок для поиска и лог-аналитики, платформа получила широкое распространение в задачах мониторинга, бизнес-аналитики, аналитики журналов и приложениях с требованием быстрой полнотекстовой выдачи. Elasticsearch поддерживает как классические текстовые индексы, так и векторные представления для семантического поиска, а также гибридные стратегии, сочетающие разные типы запросов. Взаимодействие с системой осуществляется по сетевому протоколу через удобный RESTful-интерфейс, что упрощает интеграцию с разнообразными приложениями и конвейерами обработки данных.

  • Полнотекстовый поиск: морфологический анализ, токенизация, фильтры и настраиваемые анализаторы для точной настройки индексации и поиска по тексту.
  • Масштабирование и отказоустойчивость: шардинг и репликация данных, автоматическое распределение фрагментов по узлам кластера и восстановление после сбоев.
  • RESTful API и JSON: операции индексирования, обновления, удаления и выполнения запросов через HTTP с использованием JSON-представления запросов и ответов.
  • Агрегации и аналитика: набор агрегатов для подсчётов, статистики, группировок и временных рядов, обеспечивающий аналитику на этапе поиска.
  • Поддержка векторного поиска: хранение векторных эмбеддингов и выполнение ближайшего соседнего поиска для семантических запросов.
  • Гибридные запросы: комбинирование полнотекстовых, структурных и векторных критериев в одном запросе для улучшения релевантности.
  • Интеграция с экосистемой: инструменты для сбора и передачи данных, плагины для расширения функциональности и клиенты на популярных языках программирования.
  • Безопасность и управление доступом: механизмы аутентификации, авторизации, шифрования транспорта и аудита при развертывании в продуктивных средах.
  • Поддержка временных рядов и логов: оптимизации для хранения и анализа логов, метрик и событий с возможностью ротации индексов и управления сроком хранения данных.
  • Мониторинг и эксплуатация: встроенные и внешние средства для наблюдения за состоянием кластера, производительностью запросов и использованием ресурсов.
Подробнее