ChatGPT / AI新闻聚合
17:11 · 2024年7月8日 · 周一
阿里巴巴发布语音处理模型 FunAudioLLM 能理解和生成各种人类语音
via
XiaoHu.AI学院
(author: 小互)
Telegraph
阿里巴巴发布语音处理模型 FunAudioLLM 能理解和生成各种人类语音
FunAudioLLM 是阿里巴巴开发的一组语音处理模型,旨在改善人类与大语言模型之间的语音交互。它由两个主要模型构成:SenseVoice 和 CosyVoice。 SenseVoice:语音识别模型,这个模型可以识别多种语言的语音,识别说话人的情感,检测音频中的特殊事件(比如音乐、笑声等)。它可以快速而准确地转录语音内容。 CosyVoice:语音生成模式,这个模型主要生成自然且情感丰富的语音。它可以模仿不同的说话人,甚至可以用几秒钟的音频样本来克隆一个人的声音。 通过 SenseVoice 和 CosyVoice…
Home
Tags
免费GPT聊天
Best AI API中转2.8折起
Best AI 服务状态
电报频道
Powered by
BroadcastChannel
&
Sepia
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]