Silero Models

Бесплатно
Открытый исходный код
Windows
macOS
Linux
Android
iOS
Набор компактных предварительно обученных моделей для аудио: STT (распознавание речи), TTS (синтез речи), VAD (детектор голосовой активности) и утилиты для препроцессинга и постобработки. Работают на CPU, доступны в PyTorch/ONNX и ориентированы на встраивание и edge‑использование.

Mozilla TTS

Бесплатно
Открытый исходный код
Windows
macOS
Linux
Проект глубокого синтеза речи (text-to-speech), реализующий обучение и инференс нейросетевых моделей для генерации естественной речи на разных языках.

Coqui TTS

Бесплатно
Открытый исходный код
Windows
macOS
Linux
Библиотека и набор инструментов для синтеза речи (Text-to-Speech) с предобученными моделями и возможностями обучения/тонкой настройки своих голосов. Поддерживает множество языков и локальное использование.

OpenTTS

Бесплатно
Открытый исходный код
OpenTTS — серверная обёртка для разных движков синтеза речи (Coqui TTS, Larynx, GlowTTS, eSpeak и др.), предоставляющая единый HTTP API и веб-интерфейс для генерации аудио из текста.

eSpeak NG

Бесплатно
Открытый исходный код
Windows
macOS
Linux
Android
Компактный открытый синтезатор речи (TTS), использующий формантный синтез; поддерживает более 100 языков и акцентов, доступен в виде командной утилиты и библиотеки.

Festival Speech Synthesis System

Бесплатно
Открытый исходный код
Windows
macOS
Linux
Система синтеза речи с открытым исходным кодом, разработанная в Centre for Speech Technology Research (University of Edinburgh). Предлагает полный стек TTS, набор API, инструменты для создания голосов (Festvox) и поддержку нескольких языков.

RHVoice

Бесплатно
Открытый исходный код
Windows
macOS
Linux
Android
Многоязычный синтезатор речи с фокусом на доступности для слабовидящих; предоставляет локальные голоса и интеграции с экранными чтецами (NVDA, Android TalkBack и др.).

IBM Watson Text to Speech

Бесплатно
Сервис синтеза речи от IBM, превращающий текст в естественно звучащую аудио-речь на множестве языков и голосов с поддержкой нейронных голосов, SSML и кастомизации голосов.

Amazon Polly

Бесплатно
Сервис синтеза речи от Amazon Web Services, который преобразует текст в реалистичную речь с поддержкой множества голосов и языков.

Voicery

Стартап, разрабатывающий реалистичные синтетические голоса и TTS-движки на основе глубокого обучения.

CereProc

Бесплатно
Windows
macOS
Linux
Android
iOS
Британская компания, специализирующаяся на синтезе речи и создании естественно звучащих голосов, включая голосовое клонирование и DNN/нейронные модели.

NeoSpeech

Windows
macOS
Linux
Android
iOS
NeoSpeech — компания и набор решений для синтеза речи (TTS), предоставляющая натурально звучащие голосовые движки и SDK для встраиваемых систем, мобильных, десктопных и серверных приложений.

ReadSpeaker

Сервис синтеза речи (text-to-speech), предлагающий веб-плееры, интеграции для сайтов и LMS, а также облачные и встраиваемые решения для чтения текста вслух и повышения доступности контента.

Replica Studios

Бесплатно
Сервис генерации реалистичных AI-голосов и текст‑в‑речь для творческих проектов (игры, анимация, озвучка, аудиокниги) с библиотекой голосов, настройкой эмоций и API.

Murf.ai

Бесплатно
Онлайн-сервис на основе ИИ для генерации реалистичных голосовых озвучек и синтеза речи (TTS), создание голосовых клонов, дубляжа и API для интеграции.

play.ht

Бесплатно
Онлайн-платформа преобразования текста в речь (AI TTS) с реалистичными голосами, голосовым клонированием, редактором аудио и API для встраивания.

Resemble.ai

Бесплатно
Платформа для синтеза речи и клонирования голосов с возможностями text-to-speech, speech-to-speech и реального времени; предоставляет инструменты для создания кастомных синтетических голосов, обнаружения дипфейков и API для интеграции.

WellSaid Labs

Сервис генерации реалистичных голосов на основе ИИ для озвучивания подкастов, видео, приложений и корпоративных проектов.

iSpeech

Бесплатно
Сервис и набор SDK/API для преобразования текста в речь (TTS) и распознавания речи (ASR), используемый для озвучивания контента, мобильных приложений и eLearning.

Cepstral

Windows
macOS
Linux
Провайдер технологий синтеза речи (Text-to-Speech), создаёт естественно звучащие голосовые движки и коммерческие голосовые пакеты для приложений, телефонии и встроенных систем.
1 ... 34 35 37 39 40 ... 52