OpenRefine

Бесплатно
Открытый исходный код
Windows
macOS
Linux

Сайт: openrefine.org

OpenRefine — это инструмент с открытым исходным кодом, предназначенный для очистки, трансформации и обогащения данных. Ранее известный как Google Refine, он позволяет работать с "грязными" данными, приводя их в структурированный вид, что особенно полезно при подготовке данных для анализа, визуализации или интеграции с внешними сервисами.

Программа функционирует как локальное веб-приложение, предоставляя пользователям интерфейс для обработки данных без необходимости подключения к интернету. OpenRefine поддерживает работу с различными форматами данных, включая CSV, TSV, JSON, XML и Google Таблицы, а также обеспечивает экспорт в Excel, HTML и другие форматы.

  • Фасетирование — возможность фильтрации данных по различным критериям, что облегчает анализ больших массивов информации.
  • Кластеризация — автоматическое объединение схожих значений, что помогает устранить опечатки и стандартизировать данные.
  • Трансформация данных — изменение структуры данных, включая разделение и объединение столбцов, а также применение формул для вычислений.
  • Интеграция с внешними сервисами — возможность связывания данных с внешними базами, такими как Wikidata, для обогащения информации.
  • Многоязычный интерфейс — поддержка различных языков, включая русский, что делает инструмент доступным для широкой аудитории.
  • Локальная обработка данных — все операции выполняются на локальном компьютере, что обеспечивает конфиденциальность и безопасность данных.
  • Поддержка различных форматов импорта и экспорта — возможность работы с архивами, URL и различными текстовыми форматами.
  • История изменений — возможность отслеживания и отката изменений, что обеспечивает гибкость в обработке данных.
Подробнее