
Модели используют собственный Qwen3-TTS-Tokenizer-12Hz, что позволяет эффективно сжимать аудиосигналы и воспроизводить их с высокой точностью, сохраняя чистоту речи и акустические особенности окружения. TTS-модели поддерживают десять основных языков, включая русский, а также поддерживают управление тоном, ритмом и эмоциональной окраской речи, обеспечивая генерацию аудио с низкой задержкой.
Пробуем тут — https://github.com/QwenLM/Qwen3-TTS