https://api.oaibest.com - API中转2.8折起
ChatGPT / AI新闻聚合
6 小时前
Step-Audio-EditX 发布:30亿参数音频 LLM 打开语音“可编辑时代”
via
AI新闻资讯
(author: AI Base)
Telegraph
Step-Audio-EditX 发布:30亿参数音频 LLM 打开语音“可编辑时代”
在文本生成与图像生成已被大模型彻底重塑的时代,语音编辑仍是最难以“像写文本那样”直观操作的领域。而近日,StepFun AI 发布的全新开源项目 Step-Audio-EditX 正在改变这一现状。该模型基于 30亿参数的音频语言模型(Audio LLM),首次将语音编辑转化为类似文本标记级别的可控操作,而非传统的波形信号处理任务。 根据团队在最新论文 arXiv:2511.03601中介绍,Step-Audio-EditX 的目标是让开发者能够“像改一句文本那样,直接编辑语音的情感、语调、风格甚至呼吸声”。
Home
Tags
免费GPT聊天
Best AI API中转2.8折起
Best AI 服务状态
电报频道
Powered by
BroadcastChannel
&
Sepia
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]