https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
🤖 阿里巴巴发布 Qwen3-Max-Thinking:性能比肩顶尖模型但受限于审查机制
模型性能与技术表现
阿里巴巴云推出的 Qwen3-Max-Thinking 在多项基准测试中表现出色,展现出与 GPT-5.2-Thinking、Claude-Opus-4.5 及 Gemini 3 Pro 等顶尖模型竞争的实力。根据披露的数据,该模型在 ArenaHard v2 测试中获得 90.2 分,在工具辅助搜索(Agentic Search HLE)中达到 49.8 分,均处于行业领先地位。作为 Qwen 系列中的闭源型号,Qwen3-Max 目前主要通过 API 提供服务。技术讨论指出,该模型通过增加推理过程中的 Token 消耗来提升逻辑能力,反映了当前 AI 领域“以计算换智能”的趋势。
审查机制与合规限制
Qwen3-Max 严格执行中国监管机构的审查要求。用户测试显示,涉及 1989 年天安门事件、台湾地位或新疆等敏感话题的查询会直接触发“内容安全警告”或导致连接中断。尽管部分在海外运行的轻量化版本(如 Qwen3-VL-30B)能提供相对客观的史实描述,但 Max 系列作为商业闭源模型,其内置的“思考”过程显示,模型被训练为在处理敏感话题时保持中立且模糊,以避免违反相关政策。
全球 AI 竞争与对齐差异
在与西方模型的对比中,讨论聚焦于“政治审查”与“安全对齐”的区别。虽然 ChatGPT 等美国模型也会因法律风险或防止幻觉而屏蔽特定人名(如 Jonathan Turley),但用户指出,美国模型通常允许讨论本国政府的负面历史,而中国模型则完全回避此类内容。目前,中国顶尖模型被认为落后美国前沿水平约 6 至 9 个月,其快速追赶的部分原因在于利用美国模型的输出进行蒸馏训练。
硬件需求与本地部署
针对开发者关心的本地运行问题,讨论指出在 M3 Pro(18GB 内存)等消费级硬件上难以达到前沿模型的编码质量。目前本地部署的最佳选择包括 Qwen3-Coder:30B 等模型,但其性能与托管在云端的顶级模型仍有显著差距。此外,由于算力限制,中国公司在模型架构创新之外,正更多地依赖算法优化和指令微调来提升效率。
(HackerNews)
via 茶馆 - Telegram Channel
模型性能与技术表现
阿里巴巴云推出的 Qwen3-Max-Thinking 在多项基准测试中表现出色,展现出与 GPT-5.2-Thinking、Claude-Opus-4.5 及 Gemini 3 Pro 等顶尖模型竞争的实力。根据披露的数据,该模型在 ArenaHard v2 测试中获得 90.2 分,在工具辅助搜索(Agentic Search HLE)中达到 49.8 分,均处于行业领先地位。作为 Qwen 系列中的闭源型号,Qwen3-Max 目前主要通过 API 提供服务。技术讨论指出,该模型通过增加推理过程中的 Token 消耗来提升逻辑能力,反映了当前 AI 领域“以计算换智能”的趋势。
审查机制与合规限制
Qwen3-Max 严格执行中国监管机构的审查要求。用户测试显示,涉及 1989 年天安门事件、台湾地位或新疆等敏感话题的查询会直接触发“内容安全警告”或导致连接中断。尽管部分在海外运行的轻量化版本(如 Qwen3-VL-30B)能提供相对客观的史实描述,但 Max 系列作为商业闭源模型,其内置的“思考”过程显示,模型被训练为在处理敏感话题时保持中立且模糊,以避免违反相关政策。
全球 AI 竞争与对齐差异
在与西方模型的对比中,讨论聚焦于“政治审查”与“安全对齐”的区别。虽然 ChatGPT 等美国模型也会因法律风险或防止幻觉而屏蔽特定人名(如 Jonathan Turley),但用户指出,美国模型通常允许讨论本国政府的负面历史,而中国模型则完全回避此类内容。目前,中国顶尖模型被认为落后美国前沿水平约 6 至 9 个月,其快速追赶的部分原因在于利用美国模型的输出进行蒸馏训练。
硬件需求与本地部署
针对开发者关心的本地运行问题,讨论指出在 M3 Pro(18GB 内存)等消费级硬件上难以达到前沿模型的编码质量。目前本地部署的最佳选择包括 Qwen3-Coder:30B 等模型,但其性能与托管在云端的顶级模型仍有显著差距。此外,由于算力限制,中国公司在模型架构创新之外,正更多地依赖算法优化和指令微调来提升效率。
(HackerNews)
via 茶馆 - Telegram Channel
苹果公司内部曾讨论在iPhone上引入一项基于“Apple Intelligence”的新功能,由系统通过人工智能动态重排主屏上的应用图标,以匹配用户在不同时间和场景下的使用需求。该消息来自此前《The Information》的一篇报道,报道称软件工程高级副总裁克雷格·费德里吉(Craig Federighi)的下属曾向他提交这一“AI版主屏”方案,希望通过智能分析用户行为,让常用或当前更需要的应用自动移动到更显眼的位置。
不过,费德里吉最终否决了这一设想,原因在于他担心这种频繁变动的主屏布局会让用户失去方向感。大量用户已经形成了依靠固定图标位置来快速启动应用的“肌肉记忆”,如果主屏图标经常被系统自动挪动,反而可能降低效率、增加误触和困惑。
在当前版本的iOS 26中,苹果将重点放在其他“Apple Intelligence”功能上,例如系统级的实时翻译、更强的“视觉智能”识别能力、在 Image Playground 中接入 ChatGPT 的图像生成功能,以及与快捷指令深度整合的自动化操作等。报道同时指出,更广泛、更具能力的AI功能预计将随iOS 27在今年晚些时候推出,其中包括一款由 Google Gemini 提供底层支持的新一代“Siri聊天机器人”。
《The Information》的其余内容主要聚焦于苹果在费德里吉主导下如何重组内部人工智能战略,包括在多年内部模型开发迟缓、组织摩擦不断的背景下,苹果如何加速改造 Siri,并在关键环节转而依赖外部AI模型,以推动语音助理和系统级智能的全面升级。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
Meta Platforms旗下通讯平台WhatsApp的频道功能成为最新一个受到欧盟内容审查规则约束的大型科技服务,而特朗普政府将此类规则比作审查制度。
欧盟委员会周一表示已根据《数字服务法》将WhatsApp的公开频道指定为“超大型在线平台”,这意味着该功能必须满足在内容审核和透明度方面的高标准。所谓“频道”是关联新闻机构或公众人物的开放式信息流,其性质与社交媒体类似。
这一决定出台前不久,监管机构启动了针对埃隆·马斯克旗下X平台的Grok人工智能机器人传播深度伪造色情图像的《数字服务法》调查。X平台已于去年12月因违反该法规被处以罚款。白宫方面认为,这项法律不公平地针对美国公司,并对言论自由构成审查。
彭博新闻社此前报道称,欧盟委员会已就这一指定决定通知Meta,而该公司旗下的Facebook和Instagram也被纳入同类监管范围。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
微软公司推出第二代人工智能芯片,旨在提高服务产品性能并减少对英伟达芯片的依赖。这款名为Maia 200的芯片由台积电生产,目前正陆续运往微软位于爱荷华州的数据中心,下一站将部署在凤凰城地区。微软于周一邀请开发者开始使用Maia的控制软件,目前尚不清楚Azure云服务的用户何时能使用搭载该芯片的服务器。
微软云计算与人工智能主管Scott Guthrie在博客文章中表示,首批芯片中的一部分将交付给微软的超级人工智能团队,用于生成数据以改进下一代AI模型。这些芯片还将用于驱动面向企业的Copilot助手,以及微软租赁给云客户的AI模型(包括 OpenAI的最新模型)。
微软表示,其芯片在某些AI任务上的性能优于谷歌和亚马逊云服务的同类半导体。“Maia 200也是微软部署过的最高效的推理系统,”Guthrie说道。
该公司表示,目前已在设计下一代芯片Maia 300。如果内部研发受挫,微软还有其他选择:作为与OpenAI协议的一部分,微软有权使用这家ChatGPT制造商初期的芯片设计方案。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
ChatGPT availability degraded for free and logged out users
Status: Identified
We have identified that logged out and free users are experiencing elevated errors for the impacted services. We are working on implementing a mitigation.
Affected components
● Login (Degraded performance)
● Voice mode (Degraded performance)
● Search (Degraded performance)
● Conversations (Degraded performance)
● Compliance API (Degraded performance)
● Image Generation (Degraded performance)
● GPTs (Degraded performance)
● Agent (Degraded performance)
● File uploads (Degraded performance)
● Deep Research (Degraded performance)
● Codex (Degraded performance)
● Connectors (Degraded performance)
● ChatGPT Atlas (Degraded performance)
via OpenAI status
Status: Identified
We have identified that logged out and free users are experiencing elevated errors for the impacted services. We are working on implementing a mitigation.
Affected components
● Login (Degraded performance)
● Voice mode (Degraded performance)
● Search (Degraded performance)
● Conversations (Degraded performance)
● Compliance API (Degraded performance)
● Image Generation (Degraded performance)
● GPTs (Degraded performance)
● Agent (Degraded performance)
● File uploads (Degraded performance)
● Deep Research (Degraded performance)
● Codex (Degraded performance)
● Connectors (Degraded performance)
● ChatGPT Atlas (Degraded performance)
via OpenAI status
🚀 Qwen3-Max-Thinking 旗舰推理模型发布,性能比肩 GPT-5.2
2026年1月26日,Qwen团队发布旗舰推理模型Qwen3-Max-Thinking。该模型通过大规模强化学习,在19项基准测试中展现出与GPT-5.2-Thinking、Claude-Opus-4.5相当的性能。Qwen3-Max-Thinking引入自适应工具调用能力,支持自主选择搜索与代码解释器,旨在降低幻觉并提供实时信息。模型采用“经验累积”推理时缩放策略,通过多轮自我反思机制提升逻辑推理表现。目前,Qwen3-Max-Thinking已在Qwen Chat上线,其API兼容OpenAI与Anthropic协议,支持开发者直接调用。
(科技圈)
via 茶馆 - Telegram Channel
2026年1月26日,Qwen团队发布旗舰推理模型Qwen3-Max-Thinking。该模型通过大规模强化学习,在19项基准测试中展现出与GPT-5.2-Thinking、Claude-Opus-4.5相当的性能。Qwen3-Max-Thinking引入自适应工具调用能力,支持自主选择搜索与代码解释器,旨在降低幻觉并提供实时信息。模型采用“经验累积”推理时缩放策略,通过多轮自我反思机制提升逻辑推理表现。目前,Qwen3-Max-Thinking已在Qwen Chat上线,其API兼容OpenAI与Anthropic协议,支持开发者直接调用。
(科技圈)
via 茶馆 - Telegram Channel