Silero Models
Бесплатно✱Открытый исходный кодWindowsmacOSLinuxAndroidiOS Набор компактных предварительно обученных моделей для аудио: STT (распознавание речи), TTS (синтез речи), VAD (детектор голосовой активности) и утилиты для препроцессинга и постобработки. Работают на CPU, доступны в PyTorch/ONNX и ориентированы на встраивание и edge‑использование.
Бесплатно✱
Открытый исходный код
Windows
macOS
Linux
Android
iOS
Mozilla TTS
Бесплатно✱Открытый исходный кодWindowsmacOSLinux Проект глубокого синтеза речи (text-to-speech), реализующий обучение и инференс нейросетевых моделей для генерации естественной речи на разных языках.
Бесплатно✱
Открытый исходный код
Windows
macOS
Linux
Coqui TTS
Бесплатно✱Открытый исходный кодWindowsmacOSLinux Библиотека и набор инструментов для синтеза речи (Text-to-Speech) с предобученными моделями и возможностями обучения/тонкой настройки своих голосов. Поддерживает множество языков и локальное использование.
Бесплатно✱
Открытый исходный код
Windows
macOS
Linux
OpenTTS
Бесплатно✱Открытый исходный код OpenTTS — серверная обёртка для разных движков синтеза речи (Coqui TTS, Larynx, GlowTTS, eSpeak и др.), предоставляющая единый HTTP API и веб-интерфейс для генерации аудио из текста.
Бесплатно✱
Открытый исходный код
eSpeak NG
Бесплатно✱Открытый исходный кодWindowsmacOSLinuxAndroid Компактный открытый синтезатор речи (TTS), использующий формантный синтез; поддерживает более 100 языков и акцентов, доступен в виде командной утилиты и библиотеки.
Бесплатно✱
Открытый исходный код
Windows
macOS
Linux
Android
Festival Speech Synthesis System
Бесплатно✱Открытый исходный кодWindowsmacOSLinux Система синтеза речи с открытым исходным кодом, разработанная в Centre for Speech Technology Research (University of Edinburgh). Предлагает полный стек TTS, набор API, инструменты для создания голосов (Festvox) и поддержку нескольких языков.
Бесплатно✱
Открытый исходный код
Windows
macOS
Linux
RHVoice
Бесплатно✱Открытый исходный кодWindowsmacOSLinuxAndroid Многоязычный синтезатор речи с фокусом на доступности для слабовидящих; предоставляет локальные голоса и интеграции с экранными чтецами (NVDA, Android TalkBack и др.).
Бесплатно✱
Открытый исходный код
Windows
macOS
Linux
Android
IBM Watson Text to Speech
Бесплатно✱ Сервис синтеза речи от IBM, превращающий текст в естественно звучащую аудио-речь на множестве языков и голосов с поддержкой нейронных голосов, SSML и кастомизации голосов.
Бесплатно✱
Amazon Polly
Бесплатно✱ Сервис синтеза речи от Amazon Web Services, который преобразует текст в реалистичную речь с поддержкой множества голосов и языков.
Бесплатно✱
Voicery Стартап, разрабатывающий реалистичные синтетические голоса и TTS-движки на основе глубокого обучения.
CereProc
Бесплатно✱WindowsmacOSLinuxAndroidiOS Британская компания, специализирующаяся на синтезе речи и создании естественно звучащих голосов, включая голосовое клонирование и DNN/нейронные модели.
Бесплатно✱
Windows
macOS
Linux
Android
iOS
NeoSpeech
WindowsmacOSLinuxAndroidiOS NeoSpeech — компания и набор решений для синтеза речи (TTS), предоставляющая натурально звучащие голосовые движки и SDK для встраиваемых систем, мобильных, десктопных и серверных приложений.
Windows
macOS
Linux
Android
iOS
ReadSpeaker Сервис синтеза речи (text-to-speech), предлагающий веб-плееры, интеграции для сайтов и LMS, а также облачные и встраиваемые решения для чтения текста вслух и повышения доступности контента.
Replica Studios
Бесплатно✱ Сервис генерации реалистичных AI-голосов и текст‑в‑речь для творческих проектов (игры, анимация, озвучка, аудиокниги) с библиотекой голосов, настройкой эмоций и API.
Бесплатно✱
Murf.ai
Бесплатно✱ Онлайн-сервис на основе ИИ для генерации реалистичных голосовых озвучек и синтеза речи (TTS), создание голосовых клонов, дубляжа и API для интеграции.
Бесплатно✱
play.ht
Бесплатно✱ Онлайн-платформа преобразования текста в речь (AI TTS) с реалистичными голосами, голосовым клонированием, редактором аудио и API для встраивания.
Бесплатно✱
Resemble.ai
Бесплатно✱ Платформа для синтеза речи и клонирования голосов с возможностями text-to-speech, speech-to-speech и реального времени; предоставляет инструменты для создания кастомных синтетических голосов, обнаружения дипфейков и API для интеграции.
Бесплатно✱
WellSaid Labs Сервис генерации реалистичных голосов на основе ИИ для озвучивания подкастов, видео, приложений и корпоративных проектов.
iSpeech
Бесплатно✱ Сервис и набор SDK/API для преобразования текста в речь (TTS) и распознавания речи (ASR), используемый для озвучивания контента, мобильных приложений и eLearning.
Бесплатно✱
Cepstral
WindowsmacOSLinux Провайдер технологий синтеза речи (Text-to-Speech), создаёт естественно звучащие голосовые движки и коммерческие голосовые пакеты для приложений, телефонии и встроенных систем.
Windows
macOS
Linux