PlayFi.ru -Уникальный информационный форум

Alibaba выложила в открытый доступ на Hugging Face и GitHub линейку моделей генерации речи Qwen3-TTS.

Автор темы Playfi
Дата начала
Ответы 0
Просмотры 153

Playfi

Playfi

Администратор
147
Сообщения
17
Реакции
Репутация
Ваш статус в сообществе
3
Уровень 77%
0%
25%
50%
75%
100%
2132.jpg
Модели используют собственный Qwen3-TTS-Tokenizer-12Hz, что позволяет эффективно сжимать аудиосигналы и воспроизводить их с высокой точностью, сохраняя чистоту речи и акустические особенности окружения. TTS-модели поддерживают десять основных языков, включая русский, а также поддерживают управление тоном, ритмом и эмоциональной окраской речи, обеспечивая генерацию аудио с низкой задержкой.

Пробуем тут — https://github.com/QwenLM/Qwen3-TTS
 
Сверху