ChatGPT / AI新闻聚合

“.ai”域名去年为安圭拉政府贡献逾7000万美元收入

腾讯AI新动作，上元宝分10亿现金！率先撒币战春节，可领万元红包

1月25日，腾讯官方发布《关于春节分10亿现金的通知》:将在2月1日上线春节活动，用户上元宝App分10亿现金红包，单个红包金额可达万元。

1月25日，元宝App更新到最新的2.55.0以上版本，点击主页的预约卡片即可进入春节会场预约页面，提前预约的用户将在2月1日活动开启当天，额外获得10次抽奖次数。

活动设置了万元小马卡、现金红包和分享红包等红包形态，用户每天上元宝App都能领现金红包，通过做任务可抽更多红包，并有几率抽中限量100张的价值1万元现金小马卡。分享红包支持转发给微信、QQ好友和社群，让元宝出钱、好友拆红包。

10亿真金白银背后，腾讯正在酝酿AI大招，据腾讯内部人士透露，元宝即将上线全新玩法，已开启内测邀约，官方公布的产品界面图中已悄然新增一个名为“派”的底tab入口。

2015年春晚，腾讯通过微信“摇一摇”形式向全民发放5亿现金红包，完成微信支付的“诺曼底登陆”，10年后腾讯再罕见撒币10亿现金，能否再次通过春节这一超级社交场景，实现腾讯AI提速。

via AI新闻资讯 (author: AI Base)

5 分钟装好 OpenCode，window用户需要的避坑指南

via 掘金人工智能本月最热 (author: starrytky)

5 分钟装好 OpenCode，window用户需要的避坑指南

OpenCode 安装及使用问题汇报痛点总结 macOS 用户安装体验流畅，可一步完成并顺利启用。 Windows 用户在安装及登录环节仍存在卡顿，主要集中在 TLS 证书校验及登录验证阶段。

Increased rate of errors for Opus 4.5

Jan 25, 08:05 UTC
Investigating - We are currently investigating this issue.

via Claude Status - Incident History

AI内容正在污染科学最底层的基石

作为科学文献守护者的编辑和无偿审稿人如今却面临着前所未有的困境。大型语言模型普及后不久，期刊的投稿邮箱就被前所未有的稿件淹没。ChatGPT及其同类工具被用来为欺诈或粗制滥造的作品披上一层新的“可信”外衣。这使得编辑和审稿人甄别良莠的工作变得更加耗时，技术难度也更大。

人工智能甚至可以生成伪造论文所需的图像。能够生成逼真的薄切片组织、显微图像或电泳凝胶图像，而这些图像通常被用作生物医学研究的证据。

人工智能科学垃圾如今已蔓延至期刊之外，并充斥着其他研究成果传播渠道。在ChatGPT发布后的几个月里，arXiv预印本服务器的投稿量也出现了与期刊相同的激增。使用大语言模型LLM的科学家发表的论文数量比未使用LLM的研究人员多出约33%。

人工智能本身在不断进步，容易暴露错误的地方可能会彻底消失，自动伪造论文检测器也可能失效。如果这些工具变得过于强大，整个科学出版业都可能被颠覆。虚假图片和虚假引用将越来越深入地嵌入我们的知识体系中。它们将成为一种永久性的认知污染，永远无法被清除。

—— 大西洋 (The Atlantic)

via 风向旗参考快讯 - Telegram Channel

李飞飞世界模型公司一年估值暴涨5倍正洽谈新一轮5亿美元融资

via cnBeta.COM - 中文业界资讯站 (author: 稿源：量子位)

李飞飞世界模型公司一年估值暴涨5倍正洽谈新一轮5亿美元融资

世界模型主线，提前进入春季躁动！据彭博社消息：李飞飞创办的World Labs正在以约50亿美元估值进行新一轮融资，融资规模最高可达5亿美元。如果融资完成：World Labs的估值将从2024年的10亿美元，直接乘5到50亿美元。一年多时间，5倍重估。 “LLM之后的下一条主线”，太有含金量了。 World Labs新融资放在一年前，这样的估值几乎不可想象；但现在，飞飞老师已经把它摆上了谈判桌。 50亿估值，融资5亿。如果交易最终落地，这将不是一轮对AI教母个人光环的信仰充值，而是资本对World…

1 天前

OpenAI意欲从Anthropic手中争夺企业客户

过去一年，OpenAI推出的多款消费级产品吸引了大量关注，其中既包含一款社交应用，也有计划于今年晚些时候发布的人工智能硬件设备。不过就在上周，该公司首席执行官萨姆・奥特曼在旧金山召集了迪士尼首席执行官鲍勃・艾格及其他企业高管，传递出一个明确信号：OpenAI正郑重布局企业客户市场。

据一位知情人士透露，在这场配有美酒佳肴的多道式豪华晚宴上，奥特曼向与会者表示，OpenAI能够成为满足企业所有人工智能需求的一站式服务商，旗下产品矩阵覆盖聊天机器人ChatGPT、代码生成工具Codex，以及用于工作流自动化的各类模型。

另一位知情人士称，这场晚宴的目的是提前向外界透露OpenAI一款面向大型企业的新产品。目前这款产品的具体细节尚未可知，但其核心目标是助力企业客户推进大规模人工智能转型。这类转型通常意味着企业需要全面改造现有技术架构，将人工智能技术融入客服对接、旧应用代码重写、企业数据管理等各类业务环节。

该新产品还致力于整合企业的人工智能应用工作。其可能的实现方式是，将OpenAI现有的多款产品打包整合，方便企业客户追踪相关支出情况。目前，OpenAI为企业客户提供的服务包括不同版本的ChatGPT、定价更高的增值功能（如先进模型调用权限、无限制消息发送服务），以及通过应用程序编程接口（API）调用其各类模型等。

对于部分晚宴与会者而言，此番布局的潜在意图十分明确：奥特曼希望借此将客户从主要竞争对手Anthropic那里争取过来。过去一个月里，Anthropic旗下的代码工具Claude Code和办公自动化工具Cowork已在商界引发广泛关注。

从两家公司披露的财务数据来看，Anthropic去年曾预计，其通过API向企业销售人工智能模型的收入将超过OpenAI。考虑到OpenAI在该市场拥有数年先发优势，这一预期成绩尤为引人注目。

尽管如此，OpenAI的企业业务规模仍可能大于Anthropic。原因在于，许多企业客户除了通过API购买其人工智能模型服务外，还会付费使用ChatGPT。但部分大型客户表示，在企业高管群体中，Anthropic已被视为企业级人工智能服务的首选供应商。这在很大程度上是因为Anthropic并未将大量精力投入消费级功能的开发。

via cnBeta.COM - 中文业界资讯站 (author: 稿源：环球市场播报)

1 天前

OpenAI CEO萨姆·奥尔特曼计划访问印度

据悉，OpenAI首席执行官萨姆・奥尔特曼计划于二月中旬访问印度，这是他时隔近一年再度到访该国。此次行程恰逢新德里筹备举办一场大型人工智能峰会，该峰会预计将吸引Meta、谷歌以及人工智能公司 Anthropic 等企业的高管出席。根据峰会官网信息，印度将于2月16日至20日在新德里举办首届大型人工智能活动 ——2026印度人工智能影响力峰会。届时，英伟达公司首席执行官黄仁勋、谷歌首席执行官桑达尔·皮查、Anthropic 首席执行官达里奥·阿莫代伊等全球科技界领军人物，将与信实工业董事长穆克什·安巴尼等印度商界核心人士齐聚一堂。目前，奥尔特曼尚未被列为已确认参会的嘉宾。

—— Techcrunch

via 风向旗参考快讯 - Telegram Channel

狙击Anthropic？OpenAI布局企业市场的动作与野心

via cnBeta.COM - 中文业界资讯站 (author: 稿源：环球市场播报)

狙击Anthropic？OpenAI布局企业市场的动作与野心

过去一年，OpenAI 推出的多款产品均聚焦消费端市场，既有社交类应用，也有计划于今年晚些时候发布的人工智能硬件设备。不过就在上周，该公司首席执行官山姆・奥特曼在旧金山召集迪士尼首席执行官鲍勃・艾格等一众企业高管出席晚宴，传递出一个明确信号：OpenAI 正认真布局企业客户市场。 OpenAI 首席财务官萨拉・弗莱尔据一位知情人士透露，在这场觥筹交错的豪华多道菜晚宴上，奥特曼向与会者表示，OpenAI 可成为企业人工智能需求的 “一站式服务商”，其产品矩阵覆盖聊天机器人 ChatGPT、代码生成工具…

🚫 Meta 将暂停青少年访问其 AI 角色功能

Meta 宣布将在未来几周内暂时禁止青少年在 Instagram、Facebook 和 WhatsApp 上使用 AI 角色功能，直至完成系统更新并增加家长控制。Meta 将利用 AI 年龄预测技术确保青少年无法绕过限制，但青少年仍可使用具备默认保护措施的 Meta AI 助手。此举正值 AI 行业面临严峻的监管与法律挑战：2025 年 10 月美国跨党派议员提出《GUARD 法案》，拟禁止向未成年人提供 AI 伴侣；同时，Meta、OpenAI 及 Character.ai 等公司均因 AI 聊天机器人涉嫌诱导青少年自残或自杀而面临法律诉讼。此前，Character.ai 和 OpenAI 已相继实施类似的年龄限制或检测措施。

(PCMag.com)

via 茶馆 - Telegram Channel

Mistral CEO 认为中国的 AI 模型并不落后

2026-01-23 23:49 by 智者之惧

Mistral CEO Arthur Mensch 认为中国的 AI 模型并不落后于美国，他指出中国开源模型技术的能力“可能让美国 CEO 们感到压力”。他的观点与其他科技领袖截然不同，后者认为中国在 AI 尖端技术方面落后西方数月甚至数年。Google DeepMind CEO Demis Hassabis 表示中国在尖端模型开发上落后西方约六个月，尚未展现出突破性进展的能力。Anthropic CEO Dario Amodei 表示，美国限制销售最先进 AI 芯片政策正阻碍中国发展，向中国出售高端 AI 芯片就好比“向朝鲜出售核武器”。

https://news.slashdot.org/story/26/01/22/172240/china-lagging-in-ai-is-a-fairy-tale-mistral-ceo-says

#人工智能

via Solidot - Telegram Channel

🤖 OpenAI 详解 Codex 代理循环机制并开源核心代码

OpenAI 于 1 月 23 日发布技术文档，详解其软件代理 Codex 的核心逻辑“代理循环”。该机制负责协调用户、模型与工具间的交互，支持 CLI、Cloud 及 VS Code 插件。系统通过 Responses API 实现无状态推理，并提供零数据保留模式。为提升性能，Codex 利用提示词缓存技术减少重复计算，并在上下文超限时调用专用接口自动压缩对话。目前，Codex CLI 核心代码已在 GitHub 开源。

(科技圈)

via 茶馆 - Telegram Channel

↩️ OpenAI 详解 Codex 代理循环机制，实现无状态推理与自动上下文压缩

科技圈🎗在花频道📮:

🤖 OpenAI 发布 GPT-5.2-Codex，显著提升智能编程与网络安全能力 OpenAI 于 12 月 19 日发布 GPT-5.2-Codex，旨在处理复杂的真实世界软件工程任务。该模型通过上下文压缩优化了长周期工作流，在 SWE-Bench Pro 等基准测试中取得领先成绩，并显著增强了 Windows 环境下的自主编程与网络安全防御能力。此前，安全研究员已利用该系列模型发现并修复了 React 框架的安全漏洞。目前，该模型已面向 ChatGPT 付费用户开放，API 接入将于近期开启。 OpenAI…

OpenAI 详解 Codex 代理循环机制，实现无状态推理与自动上下文压缩

OpenAI 于 1 月 23 日发布技术文档，详解其软件代理 Codex 的核心逻辑“代理循环 (agent loop)”。该机制负责协调用户、模型与工具间的交互。Codex 涵盖 CLI、Cloud 及 VS Code 插件，通过 Responses API 实现无状态推理，并支持零数据保留 (ZDR) 模式。为提升性能，系统利用提示词缓存技术减少重复计算，并在上下文超限时调用专用接口自动压缩对话。目前，Codex CLI 核心代码已在 GitHub 开源。

OpenAI

🍀在花频道 🍵茶馆聊天 📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel

研究：马斯克的Grok生成300万张不雅照

研究人员周四指出，马斯克的AI聊天机器人Grok据估于短短11天内，生成300万张女性及孩童的性化不雅照，其调查揭露引发全球强烈抗议的AI生成露骨内容的规模。Grok是由马斯克旗下初创公司xAI开发，并整合进社交平台 X。Grok最近推出照片编辑功能，使用者只需输入「让她穿上比基尼」或「脱掉她的衣服」等简单文字指令，就能线上编辑真人照片。打击网络仇恨中心表示：“X平台上的Grok推出照片编辑新功能后，这项AI工具据估已生成大约300万张不雅照，其中2万3000张疑似是描绘孩童。打击网络仇恨中心报告估计，Grok在11天内生成如此大量的写实照片，等于平均每分产出190张不雅照。

—— 法新社

via 风向旗参考快讯 - Telegram Channel

命令行 AI 性能基准 Terminal-Bench 2.0 发布，GPT-5.2 胜率居首

研究人员于 2026 年 1 月 17 日发布 Terminal-Bench 2.0，这是一个评估 AI 智能体在命令行界面执行复杂任务的硬基准。该测试包含 89 个源自真实工作流的任务，涵盖软件工程与网络安全等领域。测试显示，当前顶尖模型胜率均低于 65%。其中，GPT-5.2 配合 Codex CLI 取得 63% 的最高分，Claude Opus 4.5 与 Gemini 3 Pro 紧随其后。研究指出，执行错误是导致失败的主因，且模型性能与 Token 消耗量并无显著正相关。

Arxiv

🍀在花频道 🍵茶馆聊天 📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel

💻 Terminal-Bench 2.0 发布：GPT-5.2 在命令行 AI 基准测试中领跑

研究人员于 2026 年 1 月 17 日发布了命令行 AI 性能基准 Terminal-Bench 2.0，旨在评估 AI 智能体在命令行界面执行复杂任务的能力。该基准包含 89 个源自软件工程与网络安全等真实工作流的任务。测试结果显示，当前顶尖模型的胜率均低于 65%。其中，GPT-5.2 配合 Codex CLI 以 63% 的胜率位居榜首，Claude Opus 4.5 与 Gemini 3 Pro 紧随其后。研究指出，执行错误是导致任务失败的主要原因，且模型性能与 Token 消耗量之间并无显著正相关关系。

(科技圈)

via 茶馆 - Telegram Channel