https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
DeepSeek 网页/API 性能异常(DeepSeek Web/API Service Degraded Performance)

Mar 31, 17:02 CST
Investigating - We are currently investigating this issue.

via DeepSeek Service Status - Incident History
Elevated errors on Claude Opus 4.6

Mar 31, 08:53 UTC
Investigating - Issue started at 1:33 PT / 8:53 UTC.

via Claude Status - Incident History
ChatGPT-5.2 首次独立证明数学猜想,开启“氛围证明”时代

近日,比利时布鲁塞尔自由大学(VUB)发布了一项足以载入 AI 史册的研究成果:商用大模型已具备独立生成原创数学证明的能力。实验显示,OpenAI 旗下的 ChatGPT-5.2 (Thinking) 成功破解了由数学家 Ran 与 Teng 在 2024 年提出的悬而未决的数学猜想。

图源备注:图片由AI生成,图片授权服务商Midjourney

这一突破标志着大语言模型(LLM)的边界正式超越了代码辅助与文本创作,跨入了需要极高逻辑严密性的理论数学领域。数学界对此反应强烈,认为这预示着科学发现的范式正在发生根本性变革。

“氛围证明”横空出世:从对话中诞生的数学定理

研究团队将这种全新的科研模式命名为“vibe-proving(氛围证明)”,其灵感源自近期火爆的“氛围编程”。在整个证明过程中,ChatGPT 独立承担了证明路径的探索与核心逻辑框架的搭建,展现了超越数据组合的原创推理能力。

整个证明历经 7 轮对话交互与 4 个版本的自我迭代,最终形成了一套严谨的逻辑论证。尽管人类研究人员仍负责最后的校验工作,但 AI 表现出的推演效率远超人类数学家的预期。

行业重心位移:人类将从“生产者”转型为“验证者”

VUB 教授 Vincent Ginis 指出,这项成果打破了“AI 只有归纳能力而无创造力”的固有偏见。随着 AI 生成数学证明的门槛降低,理论数学的研究速度有望得到指数级提升。

未来数学界的核心瓶颈将从“寻找证明路径”转向“逻辑正确性校验”。当 AI 能够大规模产出高质量的猜想候选证明时,如何高效、自动化地完成人类验证,将成为下一个技术争夺的高地。

via AI新闻资讯 (author: AI Base)
ChatGPT首次原创独立证明数学假设

近日,比利时布鲁塞尔自由大学(VUB)数据分析实验室发布重磅研究成果,证实商用大型语言模型已具备独立生成原创数学证明的能力。OpenAI旗下ChatGPT-5.2(Thinking)成功破解了一项此前悬而未决的数学猜想,同时催生了名为“vibe-proving”的全新AI推理方法,相关预印本论文已于2026年2月21日发表在arXiv平台。

此次研究聚焦的核心命题,是数学家Ran与Teng在2024年提出的一项数学猜想。在数学领域,猜想是基于规律与重复验证被认为成立,但尚未经过严谨形式化证明的命题,只有完成完整有效的逻辑论证,猜想才能正式升格为定理

研究团队介绍,整个证明过程历经7轮与ChatGPT的对话交互,形成了4版逐步迭代完善的论证版本。其中,ChatGPT核心承担了证明路径探索、核心结构搭建的工作,人类研究人员则全程把控推理的正确性与逻辑完整性。

研究团队将这种大模型辅助梳理、探索复杂理论构想的模式,命名为“vibe-proving”,并提出这一方法有望复刻AI辅助编程(vibe-coding)的快速发展路径,从基础工具快速向近自动化的理论探索演进

“此前很多人认为,AI系统的创造力本质上只能局限于对训练数据的重新组合,我们的研究恰好打破了这一误解。”VUB教授VincentGinis表示。参与研究的博士后研究员BrechtVerbeken也坦言,虽早已预判ChatGPT能助力数学难题证明,但其实际表现出的效率仍远超预期。

尽管AI在此次证明中发挥了核心作用,研究团队仍反复强调,人类的参与与最终验证不可或缺,尤其是补全证明逻辑缺口、完成最终严谨校验的环节。

VUB教授Andres Algaba指出,AI将大幅加快数学猜想候选证明的生成速度,未来行业的核心瓶颈会转向人类验证环节,而语言模型同样有望在这一领域提供助力。

这项成果也标志着,大语言模型的能力边界已从辅助编程、文本创作,正式拓展至需要深度原创推理的理论数学研究领域。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)
阿里 Qwen 3.6 Plus 预览版空降 OpenRouter,100 万上下文免费开刷

3月31日,据报道,阿里千问系列的最新演进版 Qwen3.6Plus Preview 已正式登陆聚合平台OpenRouter。最令人惊喜的是,该模型目前处于限时免费状态,且拥有惊人的 100万超长上下文 处理能力。

架构跃迁:比3.5更强、更聪明的“全能代理”

作为 Qwen Plus 系列的下一代预演,Qwen3.6Plus Preview 在底层架构上进行了深度优化:

● 效率倍增: 采用更先进的混合架构,在提升模型扩展性的同时,大幅降低了推理能耗。
● 逻辑进化: 相比此前的3.5系列,新模型在逻辑推理和代理行为(Agent Behavior)的可靠性上有了显著提升。
● 基准霸榜: 官方测试显示,其在复杂问题解决、前端开发以及代理编码等核心场景下的表现,已持平甚至超越了目前市面上的顶尖旗舰模型。

门槛全开:无需充值即可白嫖100万上下文

与此前部分模型仅针对付费用户开放不同,本次OpenRouter展现了极大的诚意:

● 零成本接入: 只要拥有OpenRouter账号,即便是未充值的免费账户,也可以直接调用这款旗舰级预览版模型。
● 吞吐量惊人:100万上下文的配置,意味着用户可以一次性“喂”给 AI 数本长篇小说或庞大的工程代码库进行深度分析。

配置指南:如何快速上手?

对于习惯使用第三方工具的玩家,可以通过修改OpenClaw等插件的配置文件来实现快速接入。只需在模型列表(models)中添加 qwen/qwen3.6-plus-preview:free 路径,并设置相应的 API 密钥,即可在本地环境调用阿里的最强战力。

结语:大模型战场的“预览版”攻势

从小米 MiMo-V2到如今的 Qwen3.6Plus,厂商们正通过OpenRouter这类平台快速试水下一代技术。虽然预览版模型可能会收集部分数据用于迭代改进,但对于正处于“模型荒”、追求高性价比算力的开发者和 AI 爱好者来说,这无疑是一顿不容错过的饕餮盛宴。

via AI新闻资讯 (author: AI Base)
“DeepMind 之父”哈萨比斯:超级 AI 或导致人类灭绝,且竞赛已无法停止

近日,DeepMind 创始人德米斯·哈萨比斯(Demis Hassabis)在公开场合发表了令人警醒的言论。他坦言,正在研发中的超级人工智能确实存在灭绝人类的风险,而全球范围内的 AI 研发竞赛已进入一种“不可逆”的失控状态。

哈萨比斯指出,由于商业竞争与技术博弈的压力,传统的外部治理手段已难以对 AI 进行有效管控。这一表态引发了科技界对 AI 安全“窗口期”收窄的深度忧虑。

图源备注:图片由AI生成,图片授权服务商Midjourney

制度防线全线崩塌,安全规范让位于研发速度

哈萨比斯曾是 AI 安全的坚定倡导者,早年甚至通过独立监督和秘密研发来试图构建“技术保险箱”。然而,2022 年 ChatGPT 的横空出世打破了原有的研发节奏,导致谷歌等巨头为了应对竞争而被迫合并研发部门,原有的安全审核机制逐步失效。

他承认,此前依赖伦理委员会和外部制度来约束 AI 的构想已基本落空。在残酷的商业博弈面前,非营利性的治理机制往往难以维持其实质性的话语权。

转向个人影响力,在核心决策位把控最后防线

面对失控的现状,哈萨比斯转变了治理思路,试图通过占据核心决策位置来施加个人影响。他正一边推进 Gemini 等顶尖模型的研发,一边利用自己的技术权威在关键节点把控风险流向。

哈萨比斯的转变折射出全球 AI 竞赛的悲凉现状:统一的全球治理已成奢望。人类文明的存续,正被迫寄托于少数技术领袖对风险的敬畏之心与最后的道德自觉。

via AI新闻资讯 (author: AI Base)
估值飙升 67%:韩国 AI 芯片巨头 Rebellions 完成 4 亿美元 Pre-IPO 融资

韩国人工智能芯片独角兽 Rebellions 宣布完成 4 亿美元的 IPO 前(Pre-IPO)融资,再次刷新了亚洲 AI 硬件赛道的融资纪录。本轮注资后,该公司的市场估值已从半年前的 14 亿美元暴涨至 23.4 亿美元,展现出资本市场对非美系算力芯片的极高热忱。

回顾其融资历程,Rebellions 在过去两轮融资中累计筹得 6.5 亿美元,这一金额占到了公司成立至今总资本的 75% 以上。这种“加速跑”的融资节奏,旨在为其高性能 NPU 的规模化量产以及后续的纳斯达克或本土上市铺平道路。

算力版图扩张:从 Rebel100 到全球数据中心集群

Rebellions 目前的核心增长点在于其自主研发的 Rebel100(即 REBEL-Quad)NPU 平台,该平台正处于向全球市场规模化交付的关键期。除了深耕韩国本土,公司明确表示将利用新资金重点进攻美国市场,试图在全球 AI 推理芯片市场中抢占更多份额。

为了配合大规模 AI 部署,Rebellions 还同步推出了 RebelRack 和 RebelPOD 两款基础设施产品。前者提供生产级的推理计算单元,后者则通过机架集成构建可扩展集群,为大型企业提供从芯片到集群的完整算力解决方案。

技术自主权之战:韩系芯片能否在英伟达阴影下突围?

Rebellions 的快速崛起折射出全球供应链对“算力多样化”的迫切需求。在英伟达 GPU 长期垄断的市场格局下,低功耗、高吞吐的专用 NPU 正在成为大型互联网公司和云服务商降低运营成本的“第二选择”。

作为韩国 AI 芯片三剑客之首,Rebellions 的表现不仅关乎一家公司的成败,更代表了韩系半导体在存储优势之外,向逻辑计算核心领域的战略反攻。随着 2026 年全球算力竞赛进入深水区,这家新晋独角兽能否顺利完成 IPO,将成为衡量 AI 硬件投资热度的风向标。

via AI新闻资讯 (author: AI Base)
拒绝“公文八股”乱象:中国信通院正式启动可信 AI 公文写作评估

面对 AI 辅助写作在政企办公领域的爆发式应用,如何确保生成的公文既合规又严谨,已成为行业关注的焦点。中国信息通信研究院(下称“中国信通院”)于近日正式宣布,启动首批“可信 AI 公文写作智能体”评估工作,旨在为行业树立权威的标准化标杆。

此次评估不仅联合了科大讯飞、中移互联网等多家科技巨头共同编制规范,更标志着公文写作正式进入“有法可依”的监管新阶段。通过建立统一的技术要求,信通院试图在提升办公效率的同时,筑牢公文严肃性与准确性的技术护城河。

覆盖全流程能力,打造公文领域的“国标”参考

本次评估的核心依据是《智能体技术要求与评估方法 场景应用 公文写作》标准,涵盖了2个能力域及17项核心能力项。评估范围极广,从基础的信息抽取、会议纪要转写,到高阶的公文润色、排版及自动审核,力求覆盖公文流转的全生命周期。

除了功能性的强弱,评估还特别强调了服务的“成熟度”,将可溯源性、安全性和私有化部署能力列为考核重点。这种全方位的体检机制,能有效识别那些仅会堆砌辞藻却缺乏逻辑严密性的“伪智能”产品。

助力应用方科学选型,首批评估结果将于6月出炉

对于广大政企单位而言,公文写作智能体已成为数字化转型的标配,但市场上产品质量参差不齐,选型成本极高。信通院启动的这一官方评估,将直接通过百余项细分指标对各家产品进行“实战测试”,为应用方提供最具公信力的选型指南。

公文写作是 AI 落地最具确定性的场景之一,但其对“容错率”的要求近乎苛刻。信通院的首批评估成果预计将于2026年6月正式发布,届时公文写作领域将迎来一场关于“可信度”的洗牌,唯有真正合规、高效的智能体才能在政企市场站稳脚跟。

via AI新闻资讯 (author: AI Base)
“龙虾”还火爆吗?OpenClaw “龙虾”产品大战选型指南与避坑

2026AI 领域正式进入“全自动代理”时代。由开源框架 OpenClaw 引发的“龙虾大战”已进入白热化阶段,市面上涌现出超过20款各具特色的智能体产品,月费跨度从19元到899元不等。

这些被称为“龙虾”的 AI 智能体,核心突破在于其不仅能对话,更能直接获取系统权限来执行任务。无论是自动化处理文档、远程操控电脑,还是深度集成企业办公生态,AI 正在从“建议者”转变为真正的“执行者”。

三大阵营割据:从极客开源到大厂全家桶

目前的市场由三大势力瓜分:以 OpenClaw 为首的开源阵营深受开发者青睐,拥有超过2.6万个功能插件;腾讯、字节等互联网大厂则走“生态集成”路线。腾讯的 QClaw 实现了微信直连,而字节的 ArkClaw 则与飞书深度绑定,主打企业级高并发稳定性。

另一股势力则来自硬件厂商,华为与小米相继推出系统级“龙虾”。华为的小艺 Claw 利用鸿蒙系统的底层安全加固,主打多端协同;小米则通过 MiMo 大模型联控米家设备,将 AI 代理的触角伸向了智能家居领域。

选型避坑指南:隐私红线与 Token 陷阱

在享受自动化便利的同时,安全与成本风险也不容忽视。工信部已对部分开源版本发出预警,提醒用户本地部署的 AI 代理可能存在远程代码执行风险。建议重要任务务必由人工复核,涉及财务或高隐私操作时,应优先选择具备硬件级隔离的产品。

此外,不同产品的计费模式差异巨大,用户需警惕“Token 炸弹”。部分按量计费的平台可能因一次复杂指令触发多次 API 调用,建议在尝试 KimiClaw 或 AutoClaw 等产品时,提前设置消费上限,以防账单超出预期。

更详细指南:https://clawpk.net/

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]