Silero Models

Открытый исходный код

Windows

macOS

Linux

Android

iOS

Набор компактных предварительно обученных моделей для аудио: STT (распознавание речи), TTS (синтез речи), VAD (детектор голосовой активности) и утилиты для препроцессинга и постобработки. Работают на CPU, доступны в PyTorch/ONNX и ориентированы на встраивание и edge‑использование.

Mozilla TTS

Открытый исходный код

Windows

macOS

Linux

Проект глубокого синтеза речи (text-to-speech), реализующий обучение и инференс нейросетевых моделей для генерации естественной речи на разных языках.

Coqui TTS

Открытый исходный код

Windows

macOS

Linux

Библиотека и набор инструментов для синтеза речи (Text-to-Speech) с предобученными моделями и возможностями обучения/тонкой настройки своих голосов. Поддерживает множество языков и локальное использование.

OpenTTS

Открытый исходный код

OpenTTS — серверная обёртка для разных движков синтеза речи (Coqui TTS, Larynx, GlowTTS, eSpeak и др.), предоставляющая единый HTTP API и веб-интерфейс для генерации аудио из текста.

eSpeak NG

Открытый исходный код

Windows

macOS

Linux

Android

Компактный открытый синтезатор речи (TTS), использующий формантный синтез; поддерживает более 100 языков и акцентов, доступен в виде командной утилиты и библиотеки.

Festival Speech Synthesis System

Открытый исходный код

Windows

macOS

Linux

Система синтеза речи с открытым исходным кодом, разработанная в Centre for Speech Technology Research (University of Edinburgh). Предлагает полный стек TTS, набор API, инструменты для создания голосов (Festvox) и поддержку нескольких языков.

RHVoice

Открытый исходный код

Windows

macOS

Linux

Android

Многоязычный синтезатор речи с фокусом на доступности для слабовидящих; предоставляет локальные голоса и интеграции с экранными чтецами (NVDA, Android TalkBack и др.).

IBM Watson Text to Speech

Сервис синтеза речи от IBM, превращающий текст в естественно звучащую аудио-речь на множестве языков и голосов с поддержкой нейронных голосов, SSML и кастомизации голосов.

Amazon Polly

Сервис синтеза речи от Amazon Web Services, который преобразует текст в реалистичную речь с поддержкой множества голосов и языков.

Voicery

Стартап, разрабатывающий реалистичные синтетические голоса и TTS-движки на основе глубокого обучения.

CereProc

Windows

macOS

Linux

Android

iOS

Британская компания, специализирующаяся на синтезе речи и создании естественно звучащих голосов, включая голосовое клонирование и DNN/нейронные модели.

NeoSpeech

Windows

macOS

Linux

Android

iOS

NeoSpeech — компания и набор решений для синтеза речи (TTS), предоставляющая натурально звучащие голосовые движки и SDK для встраиваемых систем, мобильных, десктопных и серверных приложений.

ReadSpeaker

Сервис синтеза речи (text-to-speech), предлагающий веб-плееры, интеграции для сайтов и LMS, а также облачные и встраиваемые решения для чтения текста вслух и повышения доступности контента.

Replica Studios

Сервис генерации реалистичных AI-голосов и текст‑в‑речь для творческих проектов (игры, анимация, озвучка, аудиокниги) с библиотекой голосов, настройкой эмоций и API.

Murf.ai

Онлайн-сервис на основе ИИ для генерации реалистичных голосовых озвучек и синтеза речи (TTS), создание голосовых клонов, дубляжа и API для интеграции.

play.ht

Онлайн-платформа преобразования текста в речь (AI TTS) с реалистичными голосами, голосовым клонированием, редактором аудио и API для встраивания.

Resemble.ai

Платформа для синтеза речи и клонирования голосов с возможностями text-to-speech, speech-to-speech и реального времени; предоставляет инструменты для создания кастомных синтетических голосов, обнаружения дипфейков и API для интеграции.

WellSaid Labs

Сервис генерации реалистичных голосов на основе ИИ для озвучивания подкастов, видео, приложений и корпоративных проектов.

iSpeech

Сервис и набор SDK/API для преобразования текста в речь (TTS) и распознавания речи (ASR), используемый для озвучивания контента, мобильных приложений и eLearning.

Cepstral

Windows

macOS

Linux

Провайдер технологий синтеза речи (Text-to-Speech), создаёт естественно звучащие голосовые движки и коммерческие голосовые пакеты для приложений, телефонии и встроенных систем.

1 ... 34 35 36 37 38 39 40 ... 52