Trino

Бесплатно
Открытый исходный код
Linux

Сайт: trino.io

Trino — это распределённый SQL-движок с открытым исходным кодом, предназначенный для выполнения аналитических запросов на больших объёмах данных, распределённых по различным источникам. Он был разработан для обеспечения высокой производительности при обработке запросов, поддерживает параллельную обработку и масштабируемость, что делает его подходящим для работы с данными в реальном времени и в пакетном режиме.

Изначально Trino был известен как PrestoSQL, являясь форком проекта Presto, созданного в 2012 году в Facebook. В январе 2019 года основатели PrestoSQL отделились от Facebook и создали собственный проект, который в декабре 2020 года был переименован в Trino. С тех пор Trino стал основным продолжением PrestoSQL, получив более активное развитие и широкое признание в сообществе обработки данных.

  • Масштабируемость и параллельная обработка: Trino использует архитектуру MPP (Massively Parallel Processing), позволяя эффективно обрабатывать запросы на больших объёмах данных путём распределения вычислений между множеством узлов в кластере.
  • Поддержка ANSI SQL: Trino совместим с ANSI SQL, что обеспечивает поддержку стандартных SQL-запросов и упрощает интеграцию с различными инструментами аналитики и визуализации данных.
  • Федеративные запросы: Trino позволяет выполнять объединённые запросы (JOIN) между различными источниками данных, такими как MySQL, PostgreSQL, Cassandra, Kafka, MongoDB и Elasticsearch, без необходимости предварительного перемещения данных.
  • Поддержка различных форматов и систем хранения данных: Trino может работать с данными, хранящимися в форматах ORC, Parquet, CSV и JSON, а также поддерживает работу с такими системами хранения, как HDFS, AWS S3, Google Cloud Storage и Azure Blob Storage.
  • Гибкость развертывания: Trino может быть развернут как в облачных средах (например, AWS, Azure, Google Cloud), так и в локальных инфраструктурах, обеспечивая гибкость в выборе платформы для обработки данных.
  • Отсутствие хранения данных: Trino не является системой хранения данных; он выполняет запросы непосредственно на исходных данных, что позволяет избежать дублирования и избыточного хранения информации.
Подробнее