libpostal

Бесплатно
Открытый исходный код
Windows
macOS
Linux
Android
iOS

Сайт: github.com/openvenues/libpostal

libpostal — это библиотека на языке C, предназначенная для парсинга и нормализации почтовых адресов по всему миру. Она использует статистические методы обработки естественного языка (NLP) и открытые геоданные для преобразования строк, содержащих адреса, в стандартизированные и структурированные формы. Библиотека была разработана с целью решения проблемы разнообразия форматов адресов в разных странах и языках.

Проект был инициирован в 2016 году компанией Mapzen и с тех пор стал одним из самых популярных инструментов для работы с адресными данными. libpostal активно используется в геокодировании, проверке данных, а также в приложениях для доставки и навигации. Она поддерживает более 60 языков и может быть интегрирована в различные программные среды с помощью официальных привязок для Python, Java, PHP, Node.js и других языков.

  • Многоязычная поддержка: поддерживает более 60 языков, включая английский, французский, испанский, русский, китайский и другие.
  • Нормализация адресов: преобразует адресные строки в стандартизированные формы, что облегчает их обработку и анализ.
  • Парсинг компонентов адреса: извлекает отдельные элементы адреса, такие как улица, город, почтовый индекс и страна.
  • Обработка сокращений и вариаций: распознаёт и правильно интерпретирует сокращения и вариации в написании адресов.
  • Интеграция с геоданными: использует открытые геоданные, такие как OpenStreetMap и GeoNames, для улучшения точности парсинга.
  • Поддержка различных форматов: может работать с различными форматами ввода, включая текстовые строки и JSON.
  • Высокая производительность: оптимизирована для быстрого выполнения, что позволяет обрабатывать большие объёмы данных в реальном времени.
  • Открытый исходный код: распространяется под лицензией MIT, что позволяет свободно использовать и модифицировать библиотеку.
Подробнее