https://api.oaibest.com - API中转2.8折起
https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
KeePassXC 不会加入 AI 功能

2025-11-10 15:11 by 火星大师

开源密码管理器项目 KeePassXC 更新了有关使用生成式 AI 的政策,开发者强调 KeePassXC 不会提供任何 AI 功能,但会使用 GitHub Copilot 等 AI 工具去处理简单的任务,比如用 Copilot 起草简单 bug 修复和 UI 变化的 pull request。由于 AI 不擅长处理复杂任务,开发者表示会谨慎使用 Copilot,会通过标准的审核流程去发现 AI 可能产生的错误。

https://keepassxc.org/blog/2025-11-09-about-keepassxcs-code-quality-control/

#开源

via Solidot - Telegram Channel
Free ChatGPT for transitioning U.S. servicemembers and veterans

每年有数十万名美军官兵告别军旅,进入平民生活。这一转换充满机会,但也伴随诸多难题:找工作、评估教育选择、理清可用权益、住房与财务安排,以及适应新的日常。近半数的 post-9/11 退伍军人表示,融入平民生活很困难。

OpenAI 的使命是让人工智能惠及全人类,这也包括为服役者的过渡提供更多帮助。

今天我们宣布,对那些在退役或离编前后 12 个月内的 U.S. servicemembers 和退伍军人,提供一年的免费 ChatGPT Plus 订阅。该计划由在 OpenAI 工作、日常使用这些工具的退伍军人发起——他们亲身体验到 ChatGPT 在求职、准备下一阶段生活时的实用性,从简历写作到职业探索都有帮助。

获得免费 ChatGPT Plus 后,正在转型的服役者可用它来:

把军旅经历转化为便于雇主理解的简历表述;
通过逼真的问答与反馈练习面试;
清晰解读各类福利、表格与手续;
制定住房、教育、搬迁和理财等切实可行的计划;
随时获得帮助,无需排队或预约。

有意者可前往相关页面了解详情,他们将能使用我们最新的模型与功能、查看由 OpenAI 退伍军人撰写的 100 个示例对话,并在 OpenAI Academy 上观看为退伍军人定制的入门视频。我们同时与 SheerID 合作,借助其基于许可的验证平台,确保福利发放给真正服役并正处于人生下一阶段转型的人。

退伍军人带来的领导力、纪律性与适应力构成了这个国家的一部分,他们理应获得匹配这种贡献的工具。此举是我们向服役者致谢的微薄表示,希望能帮助他们更顺利地迈入人生新篇章。

----------------------

Every year, hundreds of thousands of U.S. servicemembers transition from military to civilian life. It’s a big change with lots of promise, but there’s also a lot to figure out: job hunting, evaluating education options, navigating earned benefits, housing, finances, and getting used to a new routine. Nearly half of post-9/11 veterans say their adjustment to civilian life was difficult.

OpenAI’s mission is to ensure that AI tools benefit all of humanity, and that includes making the transition a little easier for those who have served.

Today we’re announcing that U.S. servicemembers and veterans can receive a free year of ChatGPT Plus if they’re within 12 months of retirement or separation. This initiative originated with veterans working at OpenAI who use these tools every day. They know firsthand how ChatGPT can help with the next chapter, from building resumes to exploring new careers.

With free ChatGPT Plus access, transitioning servicemembers will be able to:

Write and adapt a resume so your military experience shows clearly in civilian terms
Practice interviews with realistic questions and feedback
Get straightforward explanations of benefits, forms and paperwork
Make concrete plans for housing, education, relocation and finances
Use the support anytime—no waiting, no appointment needed

U.S. servicemembers and veterans who are interested can learn more here. They will get access to our latest models and features, 100 example chats for veterans (written by OpenAI veterans), and a customized getting started video tailored to veterans and hosted on the OpenAI Academy. And we’re doing this alongside SheerID—leveraging their permission-based verification platform to make sure the access goes to those who’ve served and are transitioning to their next stage of life.

The leadership, discipline, and adaptability veterans bring to everything they do have shaped this country, and they deserve tools that match that strength. This initiative is our small way of saying thank you to those who have served. We hope it will help them move forward more easily into this next chapter.

via OpenAI News
马斯克被曝强制收集女员工信息为Grok AI提供面容与声音

Grok AI创始人埃隆·马斯克被曝使用公司女员工的生物识别数据——她们的面容和声音——来训练性感聊天AI机器人Ani。根据《华尔街日报》的调查,女员工被迫签署协议,将其数字形象的永久权利转让给公司。

今年五月,当马斯克几乎搬进AI办公室试图在人工智能竞赛中追赶竞争对手时,公司律师向员工提交了一个令人震惊的项目。他们被要求参与录制视频和音频以创建"逼真的数字化身"。项目特别侧重于为新型聊天机器人Ani打造女性形象,马斯克认为这是Grok成功的关键。

担任"AI导师"的女员工收到的文件授予该AI"永久性、全球范围、免许可费"使用其面容和声音的授权。根据内部通讯记录,一名女员工询问:"能否明确告知我们是否有拒绝的选项?"而另一名员工担心自己的形象可能被用于深度伪造或出售给第三方。这些请求均遭管理层十分强硬的拒绝。在初次询问一周后,员工收到通知称参与该项目是"推进AI使命的强制性工作要求"。

而被国外媒体描述为"性感动漫风格NSFW聊天机器人"的Ani,其外貌和行为举止均复制自真实的女员工。用户反馈该机器人具有"自然的面部表情"和"真实的语音语调",使其更具说服力。批评者指出,使用真实女性形象来创建性感数字角色引发了严重的伦理问题。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:3DMGame)
韩国顶级高校曝作弊丑闻:数百学生用AI参加考试

据央视新闻报道,韩国顶级高校延世大学近日曝出大规模作弊丑闻,约600名选修《自然语言处理(NLP)与 ChatGPT》课程的学生中,数百人涉嫌使用ChatGPT等AI工具完成期中考试

一名教授近日披露,10月15日通过在线平台进行的期中考试,他要求学生录制屏幕、手部和面部视频防止作弊。、

然而,部分学生通过调整摄像头角度或在屏幕上同时打开多个窗口的方法规避监控。

10月19日,任课教授批改试卷时发现多份答案高度相似,甚至结构和措辞完全一致,因此怀疑学生使用AI生成答案。

该教授发现作弊迹象后发出通知:主动坦白的学生其期中考试成绩将记零分,但不再面临其他处罚,被查出但未坦白者可能面临更严厉的纪律处分,包括课程挂科、停学等。

教授发布公告后,一款校园社群应用投票显示,353名参与者中有190人 (约53.8%) 承认作弊,实际涉事人数可能更多。

值得一提的是,2020 年疫情期间,韩国多所高校也曾发现类似的在线考试作弊事件,而随着AI技术的发展,相关事件肯定还会继续发生。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)
硅谷巨头秘密投资基因编辑婴儿项目

旧金山初创公司 Preventive 获得 OpenAI 首席执行官山姆·奥特曼及 Coinbase 联合创始人布莱恩·阿姆斯特朗等科技巨头投资,正秘密推进以未来实现基因编辑婴儿为目标的胚胎基因编辑临床前研究。该公司计划通过编辑胚胎,目标是预防遗传疾病,这一方向被认为在伦理和监管上挑战了美国及多国对这类实践的严格限制。Preventive 已筹集 3000 万美元,并寻求可在海外进行实验的地点。

Wall Street Journal | Business Standard

🍀在花频道 🍵茶馆 📮投稿新鲜事

via 科技圈🎗在花频道📮 - Telegram Channel
微软在Canary频道首次推出Windows 26H1测试版

在前不久有相关消息流出后,微软近日正式确认了Windows 11 26H1这一非同寻常的版本存在,这也是Windows 11历史上首次出现H1版本的大版本号更新。目前,微软已在Canary预览体验频道向Insider用户推送了Build 28000版本,供用户提前测试,更新后将会在设置>系统>关于中看到版本升级为Windows 11 26H1。

不同于常规的功能更新,微软明确表示26H1版本并非传统的年度功能大更新,该版本“仅包含平台更改以支持特定芯片”。

虽然微软没有指明具体芯片,但这很可能指的是下一代Copilot+ PC所搭载的高通骁龙X2系列等新一代Arm架构处理器。

微软强调,Windows 11仍将坚持其年度功能更新节奏,即每年接收一次重大功能更新,主要在下半年发布。

Windows 11 25H2将继续作为新功能公开发布前的“主要集中地”,因此,普通用户无需担忧错过新功能。

对于已经升级到Canary频道Build 28000的用户,本次更新带来的主要变化是版本号的提升和底层平台的改进,而在功能层面变化较小。

该版本修复了先前版本中导致“实时字幕”崩溃以及Outlook登录时凭据窗口不可用的问题;同时也存在一些已知问题,例如新版开始菜单可能会意外滚动到顶部,以及部分用户在最新版本后出现睡眠和关机功能异常。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)
5000万美元种子轮融资!斯坦福教授创立Inception,用“扩散式大模型”挑战GPT-5,代码生成速度超1000 token/秒

当全球AI竞赛仍围绕自回归大模型(如GPT-5、Gemini)激烈缠斗时,一家新锐初创公司正以颠覆性架构悄然突围。由斯坦福大学教授Stefano Ermon领衔的AI公司Inception近日宣布完成5000万美元种子轮融资,由Menlo Ventures领投,微软M12、英伟达NVentures、Snowflake Ventures、Databricks Investment及Mayfield跟投,吴恩达(Andrew Ng)与Andrej Karpathy亦以天使投资人身份加入,阵容堪称豪华。

Inception的核心押注,是将原本用于图像生成的扩散模型(Diffusion Models)全面引入文本与代码领域,挑战当前主流的自回归范式。Ermon指出,GPT、Gemini等模型采用“逐词预测”方式,必须串行处理,限制了速度与效率;而扩散模型通过并行迭代优化整体输出,在处理大规模代码库或长文本时展现出显著优势。

这一理念已落地为产品:公司同步发布其最新模型Mercury,专为软件开发场景设计,目前已集成至ProxyAI、Buildglare、Kilo Code等多款开发者工具。实测显示,Mercury在代码补全、重构与跨文件理解任务中,推理速度突破1000token/秒,远超现有自回归模型。“我们的架构天生为并行而生,”Ermon强调,“它更快、更高效,且对算力成本极度友好。”

为何扩散模型适合代码?

代码不同于自然语言——它结构严谨、依赖全局上下文,且常需跨文件关联。自回归模型在处理此类任务时,易因“逐字生成”而忽略整体逻辑一致性。而扩散模型从“噪声”出发,通过多轮全局调整逼近目标输出,天然适合高结构化数据。此外,其并行计算特性可充分利用GPU/TPU集群,显著降低延迟与能耗,直击当前AI基础设施高成本痛点。

巨头为何押注?

在AI训练与推理成本飙升的背景下,效率成为新战场。微软、英伟达、Databricks等投资方均在构建AI开发栈,亟需高性能、低开销的模型底座。Inception的路径,或为大模型商业化提供一条“省算力、高吞吐”的新出路。

AIbase认为,Inception的崛起标志着AI架构探索进入深水区——当参数竞赛边际效益递减,底层范式创新将成为破局关键。如果扩散式LLM能在代码、科研、金融等高价值场景持续验证其优势,这场由斯坦福实验室发起的技术革命,或将重塑生成式AI的未来版图。

via AI新闻资讯 (author: AI Base)
Inception 重返 AI 赛道,50百万美元融资助推新模型崛起

Inception 这家 AI 初创公司近日宣布,获得了5000万美元的新融资,重返市场竞争。该轮融资由 Menlo Ventures 领投,微软 M12、Nvidia、Databricks 和 Snowflake 等公司参与了投资。Inception 的创始人兼前首席执行官 Mustafa Suleyman 曾于2024年将公司出售给微软,以专注于撰写有关超级智能的长篇博客。

如今,Inception 正将目光投向扩散模型(dLLMs),这一技术与传统的自回归大型语言模型(LLMs)有所不同。扩散模型的生成方式并不是逐字生成,而是通过一步步的内容精炼进行创作。这一技术过去主要应用于图像生成,但 Inception 希望将其引入文本和代码的生成中。谷歌在2025年5月展示了自己的扩散模型 ——Gemini Diffusion。

Inception 的新模型 “水星”(Mercury)声称能够以每秒生成超过1000个标记的速度运作,而传统的自回归模型如 GPT-5的生成速度通常在每秒40到60个标记之间。水星模型目前已通过 OpenRouter 和 Poe 等合作伙伴向外界提供服务,定价为每百万输入标记0.25美元,输出标记为每百万1美元,这使得其在速度和成本上均优于标准的语言模型。  

划重点:

🌟 Inception 获得5000万美元融资,重返 AI 竞争。

⚙️ 新模型水星(Mercury)采用扩散模型,速度快、成本低。

🚀 水星每秒生成超过1000个标记,超越传统自回归模型。


via AI新闻资讯 (author: AI Base)
纯手工制作!《绝命毒师》主创新剧拒绝AI参与 称其是全球最贵的抄袭机器

在AI生成内容席卷影视行业的当下,一部新剧用一句简短却锋利的声明划出底线。苹果TV+最新科幻剧集《Pluribus》在片尾字幕中赫然标注:“本剧由人类制作”(This show was made by humans),紧随其后的是关于动物安全的常规提示——这一刻意并置,将“人类创作”提升至与伦理责任同等重要的地位。

该剧创作者、《绝命毒师》《风骚律师》缔造者文斯·吉利根(Vince Gilligan)更在《Variety》专访中火力全开,直言:“我讨厌AI!”他毫不留情地将生成式AI称为“全球最昂贵、最耗能的抄袭机器”,并讽刺其产出不过是“一头牛在反刍——无休止地吐出废话循环”。

图源备注:图片由AI生成,图片授权服务商Midjourney

“谢谢硅谷!”他语气讥讽,“你们又一次把世界搞砸了。”

《Pluribus》是吉利根继《X档案》后重返科幻题材的作品,由《风骚律师》主演蕾亚·塞洪(Rhea Seehorn)饰演一位浪漫奇幻小说作家,意外卷入一场疑似外星威胁的谜团。尽管题材充满未来感,但制作团队坚决拒绝AI介入剧本、概念设计或后期制作任何环节。

这一立场在当下显得尤为醒目。随着AI脚本生成、虚拟演员、AI作曲等技术被越来越多影视项目采用,“人类创作”的独特性正面临稀释。而吉利根的声明,不仅是一次艺术宣言,更可能开启行业新惯例——“人类制作”或将成为高品质原创内容的认证标签。

AIbase认为,在AI效率与人类创造力的博弈中,《Pluribus》选择站在故事、情感与作者意志的一边。当AI能模仿风格却无法理解痛苦、爱与荒诞,真正的艺术,或许永远需要一颗跳动的人类心脏。

via AI新闻资讯 (author: AI Base)
亚马逊推Kindle Translate!免费AI翻译助独立作者出海,文学“灵魂”能否留存引热议

为打破语言壁垒、激活全球阅读市场,亚马逊于本周四正式推出Kindle Translate——一项专为Kindle Direct Publishing(KDP)作者打造的AI翻译服务。目前该功能处于Beta阶段,完全免费向所有KDP作者开放,初始支持英语与西班牙语互译、德语译英语,未来将逐步扩展语种。此举直击独立作者长期面临的痛点:高昂的人工翻译成本与稀缺的本地化渠道。

据亚马逊披露,目前平台上超过95%的电子书仅以单一语言发行,意味着绝大多数作品被锁在母语市场之内。Kindle Translate旨在通过AI大幅降低翻译门槛,让小众作品也能触达全球读者。作者可在KDP后台一键选择目标语言、预览AI译文、定价并发布,翻译后的作品还可加入KDP Select计划及Kindle Unlimited订阅库,享受流量与分成权益。

然而,AI翻译的“精度焦虑”依然存在。尽管亚马逊宣称所有译文均经过“自动准确性评估”,但并未公开具体质检机制。更为关键的是,文学作品中的文化隐喻、情感张力与风格韵律,仍是当前AI难以精准捕捉的“灵魂”。一位行业人士指出:“AI可以翻译文字,但未必能翻译‘意境’——尤其在小说、诗歌等创作型文本中。”

为此,亚马逊允许作者在发布前预览译文。但若作者不掌握目标语言,这一功能形同虚设,仍需依赖专业译者校对。这也引发业内对“AI替代人类译者”的新一轮争议:支持者认为AI可处理初稿、提升效率;反对者则强调,文学翻译是再创作,而非字面转换。

值得注意的是,Kindle Translate明确标识所有AI译作,读者可在购买前预览样章,确保知情权。这一透明化策略有助于建立用户信任,也为市场提供“试水”空间。

AIbase认为,Kindle Translate的价值不在于取代人类译者,而在于为缺乏资源的独立作者提供“从0到1”的可能性。当一本小众科幻小说因AI翻译意外在拉美走红,其带来的长尾效应,或许远超翻译本身的瑕疵。在效率与美感之间寻找平衡,正是AI时代内容全球化的真实写照。而这场实验,才刚刚开始。

via AI新闻资讯 (author: AI Base)
OpenAI 推出 GPT-5-Codex-Mini:更轻、更快、更省的开发者专用模型

OpenAI 近日正式发布 GPT-5-Codex-Mini,这是一款专为开发者打造的高性价比编程模型,继9月推出的 GPT-5-Codex 后,再次拓宽了智能编程的应用边界。

GPT-5-Codex 基于 GPT-5架构,专注提升代码推理与生成能力,能够在真实软件工程任务中执行包括新项目创建、功能扩展、测试编写与大规模代码重构等多类复杂操作。其在 SWE-bench Verified 基准测试中取得74.5% 的高分,超越此前的 GPT-5High(72.8%),展现出显著性能优势。

而此次发布的 GPT-5-Codex-Mini,则是在性能与成本之间取得平衡的“轻量版”。开发者可获得比原版多4倍的调用额度,仅牺牲少量模型性能。测试数据显示,GPT-5-Codex-Mini 得分为 71.3%,在保持高准确率的同时极大降低了使用门槛。

OpenAI 建议,开发者在处理中低复杂度任务或接近调用配额上限时,可优先选择 GPT-5-Codex-Mini。值得一提的是,当调用量达到配额90% 时,系统将自动推荐用户切换至 Mini 版本,以确保项目进度不受限制。

目前,GPT-5-Codex-Mini 已支持 CLI 和 IDE 扩展,API 接口也将于近期开放。与此同时,得益于 GPU 效率提升,OpenAI 已为 ChatGPT Plus、Business 与 Edu 用户 提升50% 调用上限;Pro 与 Enterprise 用户 还将享受优先速度与资源分配。

此外,OpenAI 团队对 Codex 的底层架构进行了全面优化,解决了此前因服务器流量与路由负载造成的性能波动问题,确保开发者在高峰时段也能获得稳定、一致的调用体验

GPT-5-Codex-Mini 的推出,不仅让开发者拥有了更灵活的模型选择,更为智能编程生态注入了新的能量。对于希望以更低成本实现高效开发的团队而言,这一升级无疑是极具吸引力的选择。

via AI新闻资讯 (author: AI Base)
AI绘本引发版权与道德争议:企业家用AI完成近千幅插图的字母书

企业家尼尔斯·霍文(Niels Houwen)最近出版了一本儿童字母书,书中近1000幅插图全部由人工智能(AI)生成。霍文声称,如果由人类艺术家手工完成如此庞大的插画数量,其难度和成本都将高得不切实际。他估计,整个项目如果人工完成,成本约为5万美元,且每幅插图需要耗时约两小时。

 低价背后的成本与争议

霍文坦承,正是得益于生成式 AI,这本书才能以亲民的价格面世:提供免费的 PDF 版本,或仅需 30美元购买精装版。他强调自己并未从中盈利,所有精装版收益都用于支付亚马逊的印刷和运输成本。他透露,若完全由人类艺术家绘制,精装版的售价可能高达200美元

然而,这种利用 AI 的做法在社交媒体和亚马逊评论中引发了强烈的批评和争议。批评的焦点集中在 AI 图像生成器的伦理和版权问题上,认为这损害了人类艺术家的利益。

 法律与伦理的博弈:英国法院的判决

面对争议,一张在社交媒体上流传的截图凸显了 AI 图像生成器面临的法律困境。尽管如此,英国法院最近的判决为霍文的做法提供了一定的法律支持:判决指出,使用现有作品训练 AI 模型并不侵犯版权

霍文为该项目辩护,坚持认为这本书的主要目的是帮助儿童学习阅读,并在没有 AI 的情况下,这本书根本不可能完成。此外,该项目也兼具推广其公司的功能,该公司提供一款相关的学习应用程序。

via AI新闻资讯 (author: AI Base)
乌镇峰会重磅发布!360首发《大模型安全白皮书》,首提“全链路AI安全防线”应对智能时代新威胁

当大模型加速涌入金融、政务、能源等关键领域,其“越智能,越危险”的安全悖论正引发行业警觉。在2025年世界互联网大会乌镇峰会上,360数字安全集团正式发布国内首份《大模型安全白皮书》,系统性揭示大模型全生命周期中的五大核心风险,并首次提出“外挂式安全 + 平台原生安全”双轨治理框架,为高危AI时代拉起一道纵深防御屏障。

白皮书指出,大模型的安全威胁已形成跨层级、强耦合的复杂矩阵,涵盖五大维度:

基础设施层:算力集群、训练平台遭攻击可能导致模型被投毒或窃取;

内容层:生成虚假信息、违规内容或“AI幻觉”引发社会风险;

数据与知识库层:训练数据泄露、知识库被污染将动摇模型可信根基;

智能体层(Agent):自主决策的AI代理若被操控,可能执行恶意任务;

用户端层:提示注入、越权访问等攻击可绕过防护直接操控模型行为。
面对这一多维威胁,360提出双轨并行的安全策略:

“外挂式安全”:在模型外部部署监测、过滤与审计系统,如内容合规网关、异常行为检测;

“平台原生安全”:将安全能力内嵌至大模型研发、训练、部署、推理各环节,实现“安全即代码”。

基于该理念,360已构建覆盖数据脱敏、模型加固、内容过滤、Agent行为审计、API防护、红蓝对抗、安全合规等七大核心能力的全链路解决方案,并在金融、制造、政务等多个行业落地实践。

360强调,单靠企业防护远远不够。未来将联合产学研各方,推动大模型安全标准制定、威胁情报共享与开源安全工具共建,打造开放、协同、可信的AI安全生态。

AIbase认为,在大模型从“技术秀场”迈向“生产基础设施”的关键节点,360的白皮书不仅是一份风险预警,更是一张AI安全新基建的路线图。当智能成为生产力,安全必须成为底线——这场由360发起的防御战,关乎的不只是技术,更是AI能否被社会真正信任与托付的未来。

via AI新闻资讯 (author: AI Base)
StepFun AI 推出开源音频编辑模型 Step-Audio-EditX,实现音频编辑新体验

StepFun AI 近日发布了其开源的音频编辑模型 Step-Audio-EditX,这一创新的3B 参数模型将音频编辑的操作变得像文本编辑一样直接和可控。通过将音频信号的编辑任务转换为逐字的令牌操作,Step-Audio-EditX 使得表达性的语音编辑变得更加简单。

目前,大多数零样本文本到语音(TTS)系统在情感、风格、口音和音色的控制上都显得有限。尽管它们可以生成自然的语音,但往往无法精确地符合用户的需求。过去的研究尝试通过额外的编码器和复杂的架构来拆分这些因素,而 Step-Audio-EditX 则通过调整数据和训练目标来实现控制。

Step-Audio-EditX 采用了双代码本的标记器,将语音映射为两个令牌流,一个是以16.7Hz 的速率记录的语言流,另一个是以25Hz 的速率记录的语义流。模型在一个包含文本和音频令牌的混合语料库上进行了训练,使其能够同时处理文本和音频令牌。

该模型的关键在于采用大边距学习的方法,后续训练阶段利用合成的大边距三元组和四元组来增强模型的表现。通过使用约60000名说话者的高质量数据,模型在情感和风格编辑方面表现出色。此外,模型还利用人类评分和偏好数据进行强化学习,以提高语音生成的自然性和准确性。

为了评估模型的效果,研究团队引入了 Step-Audio-Edit-Test 基准,使用 Gemini2.5Pro 作为评判工具。测试结果显示,经过多轮编辑,模型在情感和说话风格的准确性上都显著提升。此外,Step-Audio-EditX 还可以有效提升其他闭源 TTS 系统的音频质量,为音频编辑的研究带来了新的可能性。

论文:https://arxiv.org/abs/2511.03601

划重点:

🎤 **StepFun AI 推出 Step-Audio-EditX 模型,使音频编辑更简便。**

📈 ** 该模型采用大边距学习,提升情感和风格编辑的准确性。**

🔍 ** 引入 Step-Audio-Edit-Test 基准,显著提升音频质量评估。**


via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]