ChatGPT / AI新闻聚合
1 天前
阿里通义千问重磅开源 Qwen3-TTS:97ms超低延迟语音合成,3秒克隆+一句话设计音色,彻底颠覆实时AI语音!
via
AI新闻资讯
(author: AI Base)
Telegraph
阿里通义千问重磅开源 Qwen3-TTS:97ms超低延迟语音合成,3秒克隆+一句话设计音色,彻底颠覆实时AI语音!
阿里通义千问团队昨晚正式开源了 Qwen3-TTS 系列语音生成模型家族,这一重磅更新迅速席卷开源社区,被视为语音合成领域的重大突破。该系列采用端到端架构,支持秒级音色克隆、自然语言音色设计以及实时流式输出,极大降低了实时应用的门槛。 Dual-Track双轨架构实现极致低延迟 Qwen3-TTS 核心创新在于Dual-Track双轨混合流式生成机制,结合离散多码本语言模型,直接端到端建模语音,避免了传统级联架构(如LM+DiT)的信息瓶颈。实际测试中,端到端延迟低至97ms,输入仅1个字即可输出首包音…
Home
Tags
免费GPT聊天
Best AI API中转2.8折起
Best AI 服务状态
电报频道
Powered by
BroadcastChannel
&
Sepia
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]