OrpheusDB — это система управления версиями реляционных наборов данных, разработанная для решения проблемы эффективного отслеживания и управления версиями больших структурированных данных в рамках совместной аналитики. В отличие от традиционных систем контроля версий, таких как Git, которые не подходят для работы с большими неупорядоченными наборами данных, OrpheusDB интегрируется с реляционными базами данных, предоставляя возможности версионирования без необходимости модификации самих баз данных.
Система была разработана командой из Университета Иллинойс в Урбана-Шампейне, включая таких исследователей, как Силу Хуан, Лики Сюй, Аарон Эльмор и Адития Парамешваран. OrpheusDB представляет собой тонкий слой над традиционной реляционной базой данных, который обеспечивает хранение, отслеживание и восстановление версий данных по запросу, сохраняя при этом аналитические возможности SQL. Это позволяет эффективно управлять версиями данных в процессе их анализа и совместной работы.
- Интеграция с реляционными базами данных: OrpheusDB работает поверх стандартных реляционных баз данных, таких как PostgreSQL, без необходимости их модификации.
 - Поддержка команд контроля версий: Система поддерживает команды, аналогичные Git, включая checkout, commit, init, create_user, config, whoami, ls, drop и optimize.
 - Аналитические возможности SQL: OrpheusDB позволяет выполнять SQL-запросы к известным или неизвестным версиям конкретного набора данных, обеспечивая гибкость в анализе.
 - Эффективное представление данных: Система использует продуманные схемы представления данных, такие как LYRESPLIT, для оптимизации хранения и повышения производительности при работе с большими наборами данных.
 - Поддержка совместной работы: OrpheusDB предназначена для использования в командах, позволяя нескольким пользователям работать с версиями данных, отслеживать изменения и интегрировать их в общий процесс анализа.
 - Открытый исходный код: Проект является открытым, и его исходный код доступен для использования и доработки сообществом.