Яндекс Спеллер

Бесплатно

Сайт: yandex.ru/dev/speller

Яндекс Спеллер — это веб-сервис и программный интерфейс для автоматической проверки орфографии и пунктуации в тексте на нескольких языках. Сервис предназначен для обнаружения и исправления типичных опечаток и ошибок набора, а также для выявления неправильного использования регистра и повторов слов. Яндекс Спеллер реализуется как облачный API, к которому приложения и веб‑сайты могут направлять текстовые фрагменты для анализа и получения предложений по исправлению.

В основе работы сервиса лежит сочетание языковых моделей и методов машинного обучения, адаптированных для задач контекстной проверки и ранжирования вариантов исправлений. Для повышения качества рекомендаций используются статистические подходы и обученные модели (в описаниях сервиса упоминается использование методов типа CatBoost для оценки контекстных соответствий). Сервис поддерживает несколько языков, в том числе русский, украинский и английский, и ориентирован на проверку именно орфографии: неправильные, пропущенные или лишние буквы, ошибки регистра и случайные повторы слов.

  • API‑доступ: предоставляет программный интерфейс для интеграции с веб‑приложениями, редакторами и сервисами автоматической валидации текста.
  • Многоязычность: поддержка проверки на нескольких языках, включая русский, украинский и английский.
  • Контекстная проверка: использование статистических моделей и алгоритмов машинного обучения для оценки релевантности исправлений в конкретном контексте.
  • Исправление регистра: обнаружение и приведение к корректному регистру букв в словах и аббревиатурах.
  • Обнаружение опечаток: выявление ошибок ввода, пропущенных или лишних символов и предложений правок.
  • Обработка повторов: обнаружение случайных повторов слов и фраз в тексте.
  • Конфигурация и фильтры: возможность настроить поведение проверки и фильтры для определённых типов ошибок при интеграции через API.
  • Масштабируемость: рассчитан на обработку запросов как от отдельных пользователей, так и от сервисов с большим объёмом текстов.
Подробнее