https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
微软发布三款新模型 正面抗衡OpenAI与谷歌

微软周三推出三款完全自主研发的全新基础AI模型,分别为顶尖语音转写系统、语音生成引擎及升级款图像创作模型。此举成为这家市值三万亿美元软件巨头迄今最明确的信号:其计划在模型研发层面,而非仅在分发领域,直接与OpenAI、谷歌等前沿实验室展开竞争。三款模型分别为MAI-Transcribe-1、MAI-Voice-1与MAI-Image-2,现已通过微软模型开发平台及全新MAI试用专区开放使用。它们覆盖企业AI领域三大商业价值极高的模态:语音转文字、生成逼真自然人声以及创作图像。这三款模型,是苏莱曼六个月前组建的超级智能团队打响的第一枪,该团队成立初衷,是实现他口中的“AI自主自研”。

—— 新浪财经

via 风向旗参考快讯 - Telegram Channel
Anthropic 以版权侵犯为由要求删除上万份 Claude Code 源代码副本

2026-04-02 22:26 by 金刚

Claude Code 源代码不小心泄漏之后,Anthropic 正以版权侵犯为由要求删除上万份 Claude Code 源码副本,但覆水难收,新的副本仍然源源不断的出现。开发者对该源码的分析揭示了 Anthropic 采用的一些窍门:定期回顾任务以巩固记忆,该过程被称之为“做梦(dreaming)”;某种隐藏身份的卧底模式;被称为 Buddy 的可互动电子宠物。还有开发者有其它 AI 工具和其它编程语言重写了 Claude Code,认为此举称不上版权侵犯,能免于下架的命运。

https://developers.slashdot.org/story/26/04/01/158240/anthropic-issues-copyright-takedown-requests-to-remove-8000-copies-of-claude-code-source-code
https://codeberg.org/tornikeo/claude-code

#人工智能

via Solidot - Telegram Channel
ChatGPT Dictation Elevated Error Rate

Status: Identified

We have identified that users are experiencing elevated errors for the impacted services. We are working on implementing a mitigation.

Affected components
Voice mode (Partial outage)

via OpenAI status
谷歌开源大模型Gemma 4或于4月3日发布

谷歌 DeepMind 旗下开源大模型 Gemma 系列全新迭代版本 Gemma4,大概率将于 4 月 3 日(北京时间) 凌晨正式全球发布。据内部人士透露,作为开放权重模型,Gemma4 发布后,中国内地所有开发者均可正常接入使用。Gemma 是谷歌 2024 年推出的开源大模型产品线,技术架构与谷歌旗舰闭源大模型 Gemini 同源,此前已迭代多个版本。上述知情人士表示,Gemma4 将完整延续系列的开放定位,无额外地域使用限制,内地开发者可直接获取模型权重,无需特殊申请即可完成部署、微调及二次开发。据其透露,该版本在模型性能、上下文窗口、端侧部署兼容性上均有升级。

—— 凤凰网科技

via 风向旗参考快讯 - Telegram Channel
📱 微软发布 3 款自研 AI 模型,覆盖转写、语音和图像生成

微软 4 月 2 日发布 3 款完全自研的基础 AI 模型,分别是语音转写模型 MAI-Transcribe-1、语音生成模型 MAI-Voice-1 和图像生成模型 MAI-Image-2,已通过 Microsoft Foundry 和新的 MAI Playground 上线。三款模型分别覆盖语音转文本、文本转语音和图像生成,面向企业 AI 中最具商业价值的几类应用。

在独家采访中,微软称 MAI-Transcribe-1 在 FLEURS 多语言基准测试覆盖的 25 种主要语言上平均词错误率为 3.8 %,并在这 25 种语言上全面领先 OpenAI 的 Whisper-large-v3;MAI-Voice-1 可在 1 秒内生成 60 秒语音,并支持用数秒音频定制声音;MAI-Image-2 在 Foundry 和 Copilot 中的生成速度较前代至少提升 2 倍,已开始向 Bing 和 PowerPoint 推出。

VentureBeat | MAI Playground

🌸 在花频道茶馆讨论投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
#Update #Gemini

Google AI Pro 订阅现已升级到 5TB 存储空间。

via AI Copilot - Telegram Channel
千问 3.6 正式发布:100 万长上下文,硬刚 Claude Code

4月2日,阿里官方正式发布了新一代大语言模型 Qwen3.6-Plus。这款被誉为“当下最强编程国产模型”的新作,不仅在整体性能上较3.5版本有质的飞跃,更在多个维度上无限接近全球公认的编程标杆 —— Claude 系列。

核心战力:国产第一,直逼 Claude

在系列编程能力权威评测中,Qwen3.6-Plus 脱颖而出,稳居国产模型首位。

任务自主化: 在前端网页开发、仓库级复杂任务中,它能像资深工程师一样自主拆解任务、规划路径并完成“测试-修改”的闭环。

工程落地: 该模型在长程规划任务中取得了最优成绩,不仅擅长高质量代码修复,还能熟练处理复杂的终端操作与自动化任务执行。

视觉进化:从“看懂设计稿”到“一键生成网页”

得益于原生多模态数据训练,Qwen3.6-Plus 开启了视觉智能体编程的全新可能:

链路打通: 模型可以直接基于界面截图、设计稿或自然语言描述,完成前端页面生成、代码补全及交互修改。

感知敏锐: 实现了从“看懂界面”到“调用工具完成修改”的完整闭环,极大地缩短了 UI 还原的开发周期。

生态兼容:百万级上下文,全面适配 Agent 框架

为了释放智能体的最大潜力,千问3.6在基础规格上也进行了大幅强化:

超长视野: 支持高达 100万词元(Token)的上下文窗口,能够轻松吞下整个代码库。

框架全兼容: 集中优化了对 Claude CodeOpenClaw、Qwen Code 及 Cline 等主流 Agent 框架的支持。

行业观察:让“氛围编程”真正落地

Qwen3.6-Plus 的发布,标志着编程门槛的进一步瓦解。它不仅能处理专业的跨域长程规划,更让“一句话驱动 AI 写代码”的“氛围编程”(Vibe Coding)变得真正可用且稳健。

目前,Qwen3.6-Plus 已正式登陆 千问 App 及悟空平台。国产大模型在编程领域的这一记重拳,无疑为全球 AI 开发者社区注入了新的活力。

via AI新闻资讯 (author: AI Base)
德国民众担忧 AI 深度伪造风险超九成

根据德国民调机构迪麦颇公司最新发布的调查结果,超过 90% 的德国成年人对人工智能(AI)被用于深度伪造感到忧虑。此次调查由德国电视一台委托进行,时间为 3 月 30 日至 31 日,共涉及 1316 名受访者。调查结果显示,有 53% 的受访者认为 AI 生成深度伪造内容的风险 “非常高”,而 38% 的人则认为风险 “高”。

受访者对 AI 的担忧主要集中在几个方面,包括难以辨别 AI 生成的假新闻以及工作岗位被 AI 取代的问题。在对未来五年的展望中,38% 的受访者认为 AI 将改善他们的生活,而 45% 的人则持相反观点,认为 AI 会使生活变糟。特别是在 18 岁至 34 岁的年轻群体中,有 51% 的人认为 AI 有可能改善生活。

深度伪造是指利用人工智能技术对视频、图片或音频进行合成和篡改,以制造出极具真实感的虚假内容。近年来,随着大模型技术的快速发展,利用 AI 进行换脸、换声以及生成深度伪造内容的案例频频出现,给社会带来了诸多挑战。当前,许多国家在人工智能监管法规方面仍存在不足。

早些时候,有调查显示,在美国、英国、加拿大、法国、德国和西班牙的消费者中,四分之一的美国人过去 12 个月内接到过深度伪造的语音电话。另有 24% 的人表示,难以可靠区分电话中的 AI 语音和真人声音。平均每周,六个市场的消费者会接到 7.4 通骚扰电话,其中法国的骚扰电话数量最多,而英国的受害者面临的经济损失最为严重。

随着技术的进步,诈骗分子模仿他人声音的成本和难度显著降低,这使得深度伪造的诈骗行为愈发猖獗。受害者一旦信以为真,可能会遭遇金融诈骗或身份盗窃。

划重点:

🔍 逾 90% 的德国人对 AI 用于深度伪造表示担忧,53% 认为风险 “非常高”。

💼 45% 的人认为 AI 会使生活变糟,38% 则看好 AI 未来的积极影响。

📞 四分之一的美国人接到过深度伪造语音电话,诈骗成本大幅降低。


via AI新闻资讯 (author: AI Base)
智谱发布 GLM-5V-Turbo:给 AI 智能体安上“火眼金睛”

4月2日,智谱正式发布了专为视觉编程打造的多模态 Coding 基座模型 —— GLM-5V-Turbo。这款模型不仅能写代码,更拥有了“看懂”世界的能力,旨在将 AI Agent 的感知链路从枯燥的字符延伸到丰富的设计稿与网页界面中。

核心突破:看得懂画面,写得出代码

作为原生多模态 Coding 基座,GLM-5V-Turbo 实现了视觉与编程能力的深度融合:

原生多模态感知: 能够深度理解图片、视频、设计稿及复杂的文档版面,支持画框、截图、读网页等多种视觉工具调用。

超长视野: 上下文窗口大幅扩展至 200k,让 Agent 能够轻松处理庞大的工程项目或长篇技术文档。

性能跨越: 在多模态 Coding、GUI Agent(图形用户界面智能体)等核心基准测试中,该模型以更小的尺寸取得了领先表现,且确保了纯文本场景下的逻辑推理能力不退化。

典型场景:从“草图”到“成品”的秒级跨越

GLM-5V-Turbo 的加入,让开发者可以体验到前所未有的工作流:

前端复刻: 只需发送一张草图、设计稿截图或一段操作录屏,模型即可理解布局、配色与交互逻辑,生成完整可运行的前端工程,精准还原视觉细节。

GUI 自主探索: 结合 Claude Code 等框架,它能像真人一样自主浏览网页、梳理跳转关系并采集素材,实现从“看图复刻”到“主动探索复刻”的能力跃升。

交互式编辑: 支持通过对话直接增删模块、修改文案或调整布局,实现可视化的代码迭代。

赋能“龙虾”:AutoClaw 迎来视觉进化

在智谱自研的智能体 AutoClaw(龙虾) 中接入该模型后,原本只能处理文字任务的“龙虾”具备了真正的视觉能力。

深度解读图表: 龙虾现在能直接看懂 K 线走势图、估值区间图及券商研报图表。

高效产出: 支持四路数据源在60秒内并行采集,自动生成图文并茂的专业分析报告或 PPT。

行业观察:编程不再是“盲人摸象”

随着 GLM-5V-Turbo 的发布,智谱 成功将 AI 的理解力从单纯的语法逻辑推向了感知逻辑。当 AI 能够“看见”屏幕并理解人类的操作环境时,真正的全自动编程辅助(Agentic Coding)才算真正拉开了序幕。

via AI新闻资讯 (author: AI Base)
中国广电联合会演员委员会发布声明:严禁未经授权的AI换脸与影视素材魔改

4月2日,中国广播电视社会组织联合会演员委员会针对行业内频发的AI侵权乱象发布严正声明,正式对AI换脸、声纹克隆及未经授权抓取数据训练模型等行为亮剑。

声明明确界定了七类禁止性行为,涵盖了从影视素材篡改到AI模型训练的闭环流程,并特别强调,即便标注“非商用”、“公益分享”或“个人二创”等字样,亦不能构成法律免责依据,侵权主体仍需承担全部法律责任。此举标志着演艺行业在面对生成式AI技术冲击时,正由零散的个体维权转向系统性的行业协同监管。

此次声明的发布源于持续发酵的行业维权风暴。自3月13日起,以729声工场旗下的谷江山、赵爽为代表,包括边江、季冠霖等近百位顶尖配音演员相继发声,抵制成本不足百元、仅需数分钟原声即可复刻的AI声音克隆技术。随着北京互联网法院近期宣判全国首例AI声音侵权案及短剧AI换脸明星案,司法的边界已愈发清晰。本次声明进一步明确了平台与技术方的审核义务,要求建立内容授权核验机制与侵权快速处置通道。

via AI新闻资讯 (author: AI Base)
AI 编程进入“靠谱”时代:通义实验室正式发布 Qwen3.6-Plus

继今年2月推出 Qwen3.5系列后,通义实验室于今日正式发布 Qwen3.6-Plus,旨在解决开发者在智能体编程中“任务执行不稳”的核心痛点。该模型现已通过 阿里云百炼 API 开放调用。

核心升级:聚焦 Coding Agent 与长上下文

Qwen3.6-Plus 的更新重点在于将深度逻辑推理、海量记忆与精准执行有机融合。其核心优势包括:

● 编码能力飞跃:在前端页面生成、代码修复及终端自动化场景中表现卓越。作为国内同尺寸模型中首个实现智能体编程能力全面领先的版本,它能以更低的成本提供更稳定的 Agent 体验。
● 百万级上下文:默认支持 100万 字符上下文窗口,大幅提升了长文档解析与多轮对话的信息提取精度。
● 极致性价比:模型尺寸不到 K2.5或 GLM5的一半,但在工程落地能力上紧追行业标杆。

生态兼容:无缝集成主流开发工具

为了让开发者即刻上手,Qwen3.6-Plus 已实现对多家第三方编程助手的深度适配:

● OpenClaw(原 Moltbot):支持自托管的开源 AI 编码智能体,通过简单配置即可在终端获得完整的智能体编码体验。
● Qwen Code:针对 Qwen 系列深度优化的终端智能体,支持复杂代码库理解与自动化任务。
● Claude Code:Qwen API 现已兼容 Anthropic 协议,开发者可直接在 Claude Code 工作流中调用 Qwen3.6-Plus。

视觉智能体:从“看见”到“执行”

在多模态领域,Qwen3.6-Plus 实现了从视觉感知到智能体执行的闭环。模型不仅能通过视觉输入进行复杂的财务核算(如自动计算多张刮刮乐的中奖金额与利润),还能基于设计稿直接生成前端代码。这种“视觉 Agent”能力使其能够理解 GUI 界面并执行下一步操作,逐步演进为可在真实环境中持续感知的原生多模态系统。

此外,通义实验室还为 API 引入了 preserve_thinking 功能,允许保留前序轮次的思维链内容,这对于需要长程规划的复杂智能体任务尤为有益。据悉,Qwen3.6系列的更多版本(含高性能版及轻量开源版)将于近期陆续发布。

via AI新闻资讯 (author: AI Base)
微信强化 “AI 魔改” 视频治理,处置违规短视频内容 3800 条

近日,微信平台发布了关于 “AI 魔改” 视频治理的公告(第六期),旨在进一步加强对不当内容的监管,以维护网络信息传播的良好秩序。这一举措是依据国家广播电视总局的部署要求,旨在遏制部分账号滥用 AI 工具对经典影视剧和动画片进行颠覆性篡改的问题。

在对平台内内容进行巡查时,发现一些账号存在违规发布不良导向的 “AI 魔改” 视频。这些视频扭曲了经典作品的原著精神,恶意解构主流共识,并对历史名人和英模故事进行歪曲,误导青少年价值观,损害了民族感情。此外,针对未成年人熟知的动画形象,部分视频也进行了恶意的邪典化和恐怖化改编。

根据国家相关法律法规以及《腾讯微信软件许可服务协议》和《微信视频号运营规范》的相关规定,平台对这些违规内容和账号采取了严格的处置措施。截至 2026 年 3 月,微信平台已累计处置违规短视频内容 3800 条,并对 1 个相关账号进行了封禁。这一治理行动表明了微信平台在保护网络环境和用户权益方面的决心和责任。

微信还呼吁所有内容创作者加强自律,携手共同维护清朗的网络生态。随着 “AI 魔改” 视频的治理工作持续推进,平台将进一步提升治理能力,确保对违规内容和账号的严厉打击,保障广大用户的良好体验。

下架内容案例:

1、AI魔改《三国演义》《水浒传》等经典影视作品,扭曲原著精神、颠覆角色设定、恶意解构主流共识;

2、AI魔改历史名人、英模故事,歪曲历史、亵渎英雄、误导青少年价值观,伤害民族感情;

3、AI魔改未成年人熟知的动画形象,恶意邪典化、恐怖化的改编内容。



via AI新闻资讯 (author: AI Base)
High error rate for completionsapi-gpt-5-nano

Status: Identified

We have identified that users are experiencing elevated errors for the impacted services. We are working on implementing a mitigation.

Affected components
Chat Completions (Degraded performance)

via OpenAI status
Google开源AI大模型Gemma 4即将问世

开源AI大模型目前是中国科技公司主导,美国的科技巨头在AI时代基本转向了闭源,但为了不让中国公司完全占据市场,美国巨头也会象征性拿出开源大模型,Google的Gemma 4很快要发了。

Gemma 4要发布的消息传了有段时间了,现在GoogleDeepmind创始人、CEO Demis Hassabis也发推暗示——他的内容是4颗钻石,而Gemma大模型的名称就是来自拉丁语宝石Gemma,因此这一暗示是非常明确了。

当前的Gemma 3大模型是去年3月份发布的,基于Google的Gemini 2.0,正好一年了,也是时候发布了,Gemini 3.0发布半年多了,甚至Gemini 3.1都已经发布了,这个时间差也不会影响Google的闭源大模型收费赚钱。

最让人关心的还是Gemma 4大模型的能力,当前的Gemma 3算是轻量级的,最大参数量也就27B,可以用单卡GPU运行,也支持多模态能力,能力当然没法跟Google主力大模型相比,但在开源社区口碑还是不错的。

Gemma 4此前传闻除了之前的小参数量模型之外,还会增加一个120B参数的新模型,是上代的4倍规模,但会采用MoE架构,激活参数15B,可以降低要求,依然能本地离线运行。

让Google自己的Gemini分析了下Gemma 4的能力预测,它给的答案很好很强大,甚至连深度思考能力也给了,上下文能力翻1-2倍,具备执行复杂逻辑能力。

不过也别期待太高,Google、Meta等美国科技公司做开源大模型并不会有多高优先级,也不会让开源模型能力影响到自己赚钱,Gemma 4能在本地离线运行的话,能力上限就不会太高,同参数量下也很难说能比得过国产开源的大模型。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]