Hevo Data — это облачная платформа no-code, предназначенная для автоматизации переноса, интеграции и трансформации данных (ETL / ELT). Платформа позволяет извлекать данные из множества источников — баз данных, SaaS-приложений, облачных хранилищ, потоковых сервисов — и загружать их в базы данных, хранилища данных или аналитику с минимальным участием ручного кодирования. Архитектура Hevo Data рассчитана на обработку значительных объёмов данных и способна масштабироваться автоматически в зависимости от нагрузки и требований к скорости. Исторически, компания была основана в 2017 году, её создателями являются люди, заинтересованные в решении проблем, связанных с разбросанными данными и необходимостью их консолидации для анализа. За время развития Hevo Data получила финансирование через несколько раундов, включая seed, Series A и Series B, что позволило расширить присущие возможности и географию клиентов.
Назначение Hevo Data — упростить задачу интеграции данных для как технических, так и нетехнических пользователей: аналитиков, инженеров данных и бизнес-специалистов. Платформа предлагает преднастроенные коннекторы к более чем 150 источникам и множеству назначений (хранилищ данных, BI-инструментов и др.). При этом в Hevo реализованы средства трансформации данных — как «на лету» (in-flight), так и уже после загрузки, с помощью SQL моделей, dbt-моделей и workflow-процессов. Поддержка режимов загрузки полного объёма данных и только изменений, исторической синхронизации, а также автоматического управления схемами делает платформу гибкой в разных сценариях использования.
- Поддержка множества источников и назначений данных, включая базы данных, облачные хранилища, SaaS-приложения, потоковые сервисы.
- Режимы ETL и ELT: извлечение, загрузка и трансформация данных; трансформация может происходить до загрузки, либо после, с возможностью подготовки данных для отчетности и анализа.
- Трансформация данных «на лету» (in-flight transformation), моделирование данных с использованием SQL- и dbt-моделей, рабочие процессы (workflows) для подготовки аналитически пригодных форматов.
- Историческая синхронизация данных из источников, включая опции «полной загрузки» и «инкрементального» обновления, с возможностью повторной синхронизации.
- Меньше ручного администрирования схем данных: автоматическое распознавание и обновление схем источников и назначений, управление изменениями.
- Наблюдаемость и контроль: мониторинг производительности конвейеров данных, отслеживание ошибок, отчёты об использовании, видимость состояния синхронизаций.
- Безопасность и соответствие стандартам: шифрование данных в пути и при хранении, контроль доступа, поддержка региональной обработки данных, соблюдение нормативов по защите персональных данных и стандартов индустрии.
- Гибкие модели тарификации и планы подписки: разные планы по объёму транзакций или событий, опции для бесплатного уровня, возможности доплаты или кредитов при превышении квот.