https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
经过长期酝酿的全新 Siri 将随着 iOS 26.4 的发布正式登场,并借助 Google Gemini 技术大幅强化所谓“Apple Intelligence”体系的能力。此前外界普遍预期,强化版 Siri 会在 2026 年初亮相,而近期在 iOS 26.4 系统中被发现的代码线索也被视为这一时间表的佐证。彭博社最新消息称,iOS 26.4 的存在已经得到确认,而其背后的关键原因,正是苹果已与Google签署协议,在新一代 Siri 中采用 Google Gemini 模型。
按照目前的时间安排,iOS 26.4 面向公众正式发布大致要到 3 月甚至可能是 4 月,但苹果预计会在 2 月下旬率先对外展示新 Siri 的功能。此次升级的核心,在于让 Siri 能更深入地理解并调用用户个人数据,从而实现此前广告中“问 Siri 自己曾在哪儿见过某人”那类场景化记忆查询功能,使之从概念宣传真正落地。至于届时苹果会通过一场大型发布会集中公布,还是通过较小规模的沟通形式分批释出,目前尚不明朗,其中一个可能的窗口是面向创作者的 Apple Creator Studio 线下活动及相关说明会。
外界普遍认为,苹果势必会在宣传层面大力突出新 Siri 兑现此前 AI 承诺的意义,但公司也不太可能承认这些承诺事实上已经“拖延”了接近两年。正因为此前承诺一再跳票,业界认为苹果在具体节奏上应该会更为谨慎:如果 2 月就高调宣布,而真正面向用户的功能却要等到 3 月甚至 4 月才能使用,这种“先声夺人”的做法难免显得有些操之过急。
报道中还有一项细节被认为更为可信:尽管从技术实现上看,苹果需要依赖 Google Gemini 才能在既定时间内完成新 Siri 的能力构建,但苹果在对外界的功能呈现中预计不会主动提及“Google”这一名称。据称,这套新 Siri 背后的技术在苹果内部被称作“Apple Foundation Models 版本 10”,运行在苹果自家的 Private Cloud Compute 云服务器之上,参数规模约为 1.2 万亿个,相比此前约 1500 亿参数级别的模型实现了数量级上的跃升。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
网络安全公司 LayerX 近期披露了 17 款存在恶意行为的浏览器扩展程序,这些插件涵盖翻译、视频下载、价格追踪及广告拦截等功能,总下载量超过 84 万次。受影响的浏览器包括 Google Chrome、Microsoft Edge 和 Firefox。目前,Mozilla 和微软已从官方商店下架相关插件,但已安装的用户仍需手动卸载。
调查显示,这些插件属于名为“GhostPoster”的恶意软件活动,利用隐写术将恶意代码隐藏在图片中,并通过延迟执行技术在安装数周或数月后才触发恶意行为。一旦激活,这些插件能够篡改 HTTP 标头以削弱网页安全策略、劫持联盟流量获利、注入脚本进行点击欺诈及用户追踪,甚至能自动破解验证码。其中,下载量最高的插件包括“Google Translate in Right Click”(超 50 万次)和“Translate Selected Text with Google”(约 16 万次)。
此外,相关调查还指出,拥有 800 万用户的 Urban VPN Proxy 插件也在秘密收集用户与 ChatGPT、Claude 及 Gemini 等 AI 工具的对话数据,并将其出售给数据经纪商。该插件同样采用了在图片中隐藏代码的手段来渗透用户设备。
(PCMag.com)
via 茶馆 - Telegram Channel
Increased rate of errors for Opus 4.5
Jan 25, 08:05 UTC
Investigating - We are currently investigating this issue.
via Claude Status - Incident History
Jan 25, 08:05 UTC
Investigating - We are currently investigating this issue.
via Claude Status - Incident History
AI内容正在污染科学最底层的基石
作为科学文献守护者的编辑和无偿审稿人如今却面临着前所未有的困境。大型语言模型普及后不久,期刊的投稿邮箱就被前所未有的稿件淹没。ChatGPT及其同类工具被用来为欺诈或粗制滥造的作品披上一层新的“可信”外衣。这使得编辑和审稿人甄别良莠的工作变得更加耗时,技术难度也更大。
人工智能甚至可以生成伪造论文所需的图像。能够生成逼真的薄切片组织、显微图像或电泳凝胶图像,而这些图像通常被用作生物医学研究的证据。
人工智能科学垃圾如今已蔓延至期刊之外,并充斥着其他研究成果传播渠道。在ChatGPT发布后的几个月里,arXiv预印本服务器的投稿量也出现了与期刊相同的激增。使用大语言模型LLM的科学家发表的论文数量比未使用LLM的研究人员多出约33%。
人工智能本身在不断进步,容易暴露错误的地方可能会彻底消失,自动伪造论文检测器也可能失效。如果这些工具变得过于强大,整个科学出版业都可能被颠覆。虚假图片和虚假引用将越来越深入地嵌入我们的知识体系中。它们将成为一种永久性的认知污染,永远无法被清除。
—— 大西洋 (The Atlantic)
via 风向旗参考快讯 - Telegram Channel
作为科学文献守护者的编辑和无偿审稿人如今却面临着前所未有的困境。大型语言模型普及后不久,期刊的投稿邮箱就被前所未有的稿件淹没。ChatGPT及其同类工具被用来为欺诈或粗制滥造的作品披上一层新的“可信”外衣。这使得编辑和审稿人甄别良莠的工作变得更加耗时,技术难度也更大。
人工智能甚至可以生成伪造论文所需的图像。能够生成逼真的薄切片组织、显微图像或电泳凝胶图像,而这些图像通常被用作生物医学研究的证据。
人工智能科学垃圾如今已蔓延至期刊之外,并充斥着其他研究成果传播渠道。在ChatGPT发布后的几个月里,arXiv预印本服务器的投稿量也出现了与期刊相同的激增。使用大语言模型LLM的科学家发表的论文数量比未使用LLM的研究人员多出约33%。
人工智能本身在不断进步,容易暴露错误的地方可能会彻底消失,自动伪造论文检测器也可能失效。如果这些工具变得过于强大,整个科学出版业都可能被颠覆。虚假图片和虚假引用将越来越深入地嵌入我们的知识体系中。它们将成为一种永久性的认知污染,永远无法被清除。
—— 大西洋 (The Atlantic)
via 风向旗参考快讯 - Telegram Channel
过去一年,OpenAI推出的多款消费级产品吸引了大量关注,其中既包含一款社交应用,也有计划于今年晚些时候发布的人工智能硬件设备。不过就在上周,该公司首席执行官萨姆・奥特曼在旧金山召集了迪士尼首席执行官鲍勃・艾格及其他企业高管,传递出一个明确信号:OpenAI正郑重布局企业客户市场。
据一位知情人士透露,在这场配有美酒佳肴的多道式豪华晚宴上,奥特曼向与会者表示,OpenAI能够成为满足企业所有人工智能需求的一站式服务商,旗下产品矩阵覆盖聊天机器人ChatGPT、代码生成工具Codex,以及用于工作流自动化的各类模型。
另一位知情人士称,这场晚宴的目的是提前向外界透露OpenAI一款面向大型企业的新产品。目前这款产品的具体细节尚未可知,但其核心目标是助力企业客户推进大规模人工智能转型。这类转型通常意味着企业需要全面改造现有技术架构,将人工智能技术融入客服对接、旧应用代码重写、企业数据管理等各类业务环节。
该新产品还致力于整合企业的人工智能应用工作。其可能的实现方式是,将OpenAI现有的多款产品打包整合,方便企业客户追踪相关支出情况。目前,OpenAI为企业客户提供的服务包括不同版本的ChatGPT、定价更高的增值功能(如先进模型调用权限、无限制消息发送服务),以及通过应用程序编程接口(API)调用其各类模型等。
对于部分晚宴与会者而言,此番布局的潜在意图十分明确:奥特曼希望借此将客户从主要竞争对手Anthropic那里争取过来。过去一个月里,Anthropic旗下的代码工具Claude Code和办公自动化工具Cowork已在商界引发广泛关注。
从两家公司披露的财务数据来看,Anthropic去年曾预计,其通过API向企业销售人工智能模型的收入将超过OpenAI。考虑到OpenAI在该市场拥有数年先发优势,这一预期成绩尤为引人注目。
尽管如此,OpenAI的企业业务规模仍可能大于Anthropic。原因在于,许多企业客户除了通过API购买其人工智能模型服务外,还会付费使用ChatGPT。但部分大型客户表示,在企业高管群体中,Anthropic已被视为企业级人工智能服务的首选供应商。这在很大程度上是因为Anthropic并未将大量精力投入消费级功能的开发。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
OpenAI CEO萨姆·奥尔特曼计划访问印度
据悉,OpenAI首席执行官萨姆・奥尔特曼计划于二月中旬访问印度,这是他时隔近一年再度到访该国。此次行程恰逢新德里筹备举办一场大型人工智能峰会,该峰会预计将吸引Meta、谷歌以及人工智能公司 Anthropic 等企业的高管出席。根据峰会官网信息,印度将于2月16日至20日在新德里举办首届大型人工智能活动 ——2026印度人工智能影响力峰会。届时,英伟达公司首席执行官黄仁勋、谷歌首席执行官桑达尔·皮查、Anthropic 首席执行官达里奥·阿莫代伊等全球科技界领军人物,将与信实工业董事长穆克什·安巴尼等印度商界核心人士齐聚一堂。目前,奥尔特曼尚未被列为已确认参会的嘉宾。
—— Techcrunch
via 风向旗参考快讯 - Telegram Channel
据悉,OpenAI首席执行官萨姆・奥尔特曼计划于二月中旬访问印度,这是他时隔近一年再度到访该国。此次行程恰逢新德里筹备举办一场大型人工智能峰会,该峰会预计将吸引Meta、谷歌以及人工智能公司 Anthropic 等企业的高管出席。根据峰会官网信息,印度将于2月16日至20日在新德里举办首届大型人工智能活动 ——2026印度人工智能影响力峰会。届时,英伟达公司首席执行官黄仁勋、谷歌首席执行官桑达尔·皮查、Anthropic 首席执行官达里奥·阿莫代伊等全球科技界领军人物,将与信实工业董事长穆克什·安巴尼等印度商界核心人士齐聚一堂。目前,奥尔特曼尚未被列为已确认参会的嘉宾。
—— Techcrunch
via 风向旗参考快讯 - Telegram Channel
Meta 宣布将在未来几周内暂时禁止青少年在 Instagram、Facebook 和 WhatsApp 上使用 AI 角色功能,直至完成系统更新并增加家长控制。Meta 将利用 AI 年龄预测技术确保青少年无法绕过限制,但青少年仍可使用具备默认保护措施的 Meta AI 助手。此举正值 AI 行业面临严峻的监管与法律挑战:2025 年 10 月美国跨党派议员提出《GUARD 法案》,拟禁止向未成年人提供 AI 伴侣;同时,Meta、OpenAI 及 Character.ai 等公司均因 AI 聊天机器人涉嫌诱导青少年自残或自杀而面临法律诉讼。此前,Character.ai 和 OpenAI 已相继实施类似的年龄限制或检测措施。
(PCMag.com)
via 茶馆 - Telegram Channel
Mistral CEO 认为中国的 AI 模型并不落后
2026-01-23 23:49 by 智者之惧
Mistral CEO Arthur Mensch 认为中国的 AI 模型并不落后于美国,他指出中国开源模型技术的能力“可能让美国 CEO 们感到压力”。他的观点与其他科技领袖截然不同,后者认为中国在 AI 尖端技术方面落后西方数月甚至数年。Google DeepMind CEO Demis Hassabis 表示中国在尖端模型开发上落后西方约六个月,尚未展现出突破性进展的能力。Anthropic CEO Dario Amodei 表示,美国限制销售最先进 AI 芯片政策正阻碍中国发展,向中国出售高端 AI 芯片就好比“向朝鲜出售核武器”。
https://news.slashdot.org/story/26/01/22/172240/china-lagging-in-ai-is-a-fairy-tale-mistral-ceo-says
#人工智能
via Solidot - Telegram Channel
2026-01-23 23:49 by 智者之惧
Mistral CEO Arthur Mensch 认为中国的 AI 模型并不落后于美国,他指出中国开源模型技术的能力“可能让美国 CEO 们感到压力”。他的观点与其他科技领袖截然不同,后者认为中国在 AI 尖端技术方面落后西方数月甚至数年。Google DeepMind CEO Demis Hassabis 表示中国在尖端模型开发上落后西方约六个月,尚未展现出突破性进展的能力。Anthropic CEO Dario Amodei 表示,美国限制销售最先进 AI 芯片政策正阻碍中国发展,向中国出售高端 AI 芯片就好比“向朝鲜出售核武器”。
https://news.slashdot.org/story/26/01/22/172240/china-lagging-in-ai-is-a-fairy-tale-mistral-ceo-says
#人工智能
via Solidot - Telegram Channel
🤖 OpenAI 详解 Codex 代理循环机制并开源核心代码
OpenAI 于 1 月 23 日发布技术文档,详解其软件代理 Codex 的核心逻辑“代理循环”。该机制负责协调用户、模型与工具间的交互,支持 CLI、Cloud 及 VS Code 插件。系统通过 Responses API 实现无状态推理,并提供零数据保留模式。为提升性能,Codex 利用提示词缓存技术减少重复计算,并在上下文超限时调用专用接口自动压缩对话。目前,Codex CLI 核心代码已在 GitHub 开源。
(科技圈)
via 茶馆 - Telegram Channel
OpenAI 于 1 月 23 日发布技术文档,详解其软件代理 Codex 的核心逻辑“代理循环”。该机制负责协调用户、模型与工具间的交互,支持 CLI、Cloud 及 VS Code 插件。系统通过 Responses API 实现无状态推理,并提供零数据保留模式。为提升性能,Codex 利用提示词缓存技术减少重复计算,并在上下文超限时调用专用接口自动压缩对话。目前,Codex CLI 核心代码已在 GitHub 开源。
(科技圈)
via 茶馆 - Telegram Channel
↩️ OpenAI 详解 Codex 代理循环机制,实现无状态推理与自动上下文压缩
OpenAI 详解 Codex 代理循环机制,实现无状态推理与自动上下文压缩
OpenAI 于 1 月 23 日发布技术文档,详解其软件代理 Codex 的核心逻辑“代理循环 (agent loop)”。该机制负责协调用户、模型与工具间的交互。Codex 涵盖 CLI、Cloud 及 VS Code 插件,通过 Responses API 实现无状态推理,并支持零数据保留 (ZDR) 模式。为提升性能,系统利用提示词缓存技术减少重复计算,并在上下文超限时调用专用接口自动压缩对话。目前,Codex CLI 核心代码已在 GitHub 开源。
OpenAI
🍀在花频道 🍵茶馆聊天 📮投稿
via 科技圈🎗在花频道📮 - Telegram Channel
科技圈🎗在花频道📮:
🤖 OpenAI 发布 GPT-5.2-Codex,显著提升智能编程与网络安全能力 OpenAI 于 12 月 19 日发布 GPT-5.2-Codex,旨在处理复杂的真实世界软件工程任务。该模型通过上下文压缩优化了长周期工作流,在 SWE-Bench Pro 等基准测试中取得领先成绩,并显著增强了 Windows 环境下的自主编程与网络安全防御能力。此前,安全研究员已利用该系列模型发现并修复了 React 框架的安全漏洞。目前,该模型已面向 ChatGPT 付费用户开放,API 接入将于近期开启。 OpenAI…
OpenAI 详解 Codex 代理循环机制,实现无状态推理与自动上下文压缩
OpenAI 于 1 月 23 日发布技术文档,详解其软件代理 Codex 的核心逻辑“代理循环 (agent loop)”。该机制负责协调用户、模型与工具间的交互。Codex 涵盖 CLI、Cloud 及 VS Code 插件,通过 Responses API 实现无状态推理,并支持零数据保留 (ZDR) 模式。为提升性能,系统利用提示词缓存技术减少重复计算,并在上下文超限时调用专用接口自动压缩对话。目前,Codex CLI 核心代码已在 GitHub 开源。
OpenAI
🍀在花频道 🍵茶馆聊天 📮投稿
via 科技圈🎗在花频道📮 - Telegram Channel
研究:马斯克的Grok生成300万张不雅照
研究人员周四指出,马斯克的AI聊天机器人Grok据估于短短11天内,生成300万张女性及孩童的性化不雅照,其调查揭露引发全球强烈抗议的AI生成露骨内容的规模。Grok是由马斯克旗下初创公司xAI开发,并整合进社交平台 X。Grok最近推出照片编辑功能,使用者只需输入「让她穿上比基尼」或「脱掉她的衣服」等简单文字指令,就能线上编辑真人照片。打击网络仇恨中心表示:“X平台上的Grok推出照片编辑新功能后,这项AI工具据估已生成大约300万张不雅照,其中2万3000张疑似是描绘孩童。打击网络仇恨中心报告估计,Grok在11天内生成如此大量的写实照片,等于平均每分产出190张不雅照。
—— 法新社
via 风向旗参考快讯 - Telegram Channel
研究人员周四指出,马斯克的AI聊天机器人Grok据估于短短11天内,生成300万张女性及孩童的性化不雅照,其调查揭露引发全球强烈抗议的AI生成露骨内容的规模。Grok是由马斯克旗下初创公司xAI开发,并整合进社交平台 X。Grok最近推出照片编辑功能,使用者只需输入「让她穿上比基尼」或「脱掉她的衣服」等简单文字指令,就能线上编辑真人照片。打击网络仇恨中心表示:“X平台上的Grok推出照片编辑新功能后,这项AI工具据估已生成大约300万张不雅照,其中2万3000张疑似是描绘孩童。打击网络仇恨中心报告估计,Grok在11天内生成如此大量的写实照片,等于平均每分产出190张不雅照。
—— 法新社
via 风向旗参考快讯 - Telegram Channel
研究人员于 2026 年 1 月 17 日发布 Terminal-Bench 2.0,这是一个评估 AI 智能体在命令行界面执行复杂任务的硬基准。该测试包含 89 个源自真实工作流的任务,涵盖软件工程与网络安全等领域。测试显示,当前顶尖模型胜率均低于 65%。其中,GPT-5.2 配合 Codex CLI 取得 63% 的最高分,Claude Opus 4.5 与 Gemini 3 Pro 紧随其后。研究指出,执行错误是导致失败的主因,且模型性能与 Token 消耗量并无显著正相关。
Arxiv
🍀在花频道 🍵茶馆聊天 📮投稿
via 科技圈🎗在花频道📮 - Telegram Channel
💻 Terminal-Bench 2.0 发布:GPT-5.2 在命令行 AI 基准测试中领跑
研究人员于 2026 年 1 月 17 日发布了命令行 AI 性能基准 Terminal-Bench 2.0,旨在评估 AI 智能体在命令行界面执行复杂任务的能力。该基准包含 89 个源自软件工程与网络安全等真实工作流的任务。测试结果显示,当前顶尖模型的胜率均低于 65%。其中,GPT-5.2 配合 Codex CLI 以 63% 的胜率位居榜首,Claude Opus 4.5 与 Gemini 3 Pro 紧随其后。研究指出,执行错误是导致任务失败的主要原因,且模型性能与 Token 消耗量之间并无显著正相关关系。
(科技圈)
via 茶馆 - Telegram Channel
研究人员于 2026 年 1 月 17 日发布了命令行 AI 性能基准 Terminal-Bench 2.0,旨在评估 AI 智能体在命令行界面执行复杂任务的能力。该基准包含 89 个源自软件工程与网络安全等真实工作流的任务。测试结果显示,当前顶尖模型的胜率均低于 65%。其中,GPT-5.2 配合 Codex CLI 以 63% 的胜率位居榜首,Claude Opus 4.5 与 Gemini 3 Pro 紧随其后。研究指出,执行错误是导致任务失败的主要原因,且模型性能与 Token 消耗量之间并无显著正相关关系。
(科技圈)
via 茶馆 - Telegram Channel
Google DeepMind 首席执行官德米斯·哈萨比斯(Demis Hassabis)在达沃斯世界经济论坛上警告称,AI 行业部分领域的过度繁荣已显现“泡沫”特征。他指出,一些初创公司在缺乏产品和技术的情况下仍能获得数十亿美元的种子轮融资,这种脱离商业现实的现象难以持续,并可能引发市场回调。尽管英伟达和微软的高管对过度投资的担忧持保留意见,但哈萨比斯强调,部分依赖债务驱动的 AI 基础设施交易以及估值虚高的初创企业已引起警惕。
目前,母公司 Alphabet 的市值已突破 4 万亿美元,成为仅次于英伟达的全球第二大公司。哈萨比斯表示,即便泡沫破裂,Google 凭借 Gemini 3 等模型的强劲需求和成熟的业务体系也能保持稳健。在国际竞争方面,他认为西方在 AI 研发上仍领先中国约六个月,并称市场对中国 DeepSeek 模型的反应属于“过度反应”。他分析称,中国公司目前更侧重于追求短期收益的近期应用,而 DeepMind、OpenAI 和 Anthropic 则继续专注于通用人工智能(AGI)的前沿研究。
针对 AI 带来的社会风险,哈萨比斯强调了安全与负责任开发的重要性,主张将技术应用于科学和医疗等领域。此外,他预测通用数字助手将成为智能眼镜的“杀手级应用”,助力 Google 实现其长达十年的可穿戴设备愿景。在个人职业规划方面,哈萨比斯明确表示无意接替桑达尔·皮查伊(Sundar Pichai)担任 Alphabet 首席执行官,称其更倾向于专注于科学研究。
(FT)
via 茶馆 - Telegram Channel