ChatGPT / AI新闻聚合

https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN

04:14 · 2025年10月28日 · 周二

🧠 OpenAI ChatGPT 心理健康安全升级：与百余专家合作，不当回应率大降65-80%

OpenAI 宣布对 ChatGPT 进行重大安全升级，专门优化心理健康相关的敏感对话。该公司与超过 170 位心理健康专家合作，训练 GPT-5 模型更好地识别用户痛苦信号，提供关怀回应，并引导用户寻求现实世界的专业支持。此次升级显著改善了模型在处理精神病、躁狂、自伤、自杀倾向以及对 AI 情感依赖等方面的表现，将不当回应率降低了 65-80%。专家评估显示，与 GPT-4o 相比，不当回应减少了 39-52%。此外，OpenAI 还扩展了危机热线访问，将敏感对话重新路由到更安全的模型，并在长时间会话中添加了温和的休息提醒。

(科技圈)

via 茶馆 - Telegram Channel

04:14 · 2025年10月28日 · 周二

🤖 Anthropic Claude Code：从“意外”到AI编程新范式

Anthropic的AI编程工具Claude Code于2025年2月推出，其负责人Boris Cherny透露，该工具的诞生“纯属意外”。Claude Code已成为Anthropic工程师的日常习惯，日活跃用户达80%-90%，周活跃用户达100%，并被Salesforce、Uber和Deloitte等客户采用。

该工具现已通过标准网页浏览器提供，订阅费用为Pro版每月17美元，Max版每月100美元，旨在让非专业人士也能轻松使用。Cherny强调，Claude Code是首个“完全代理式”编程产品，能自主修复bug、更新文件、进行代码审查，并与Asana等项目管理工具集成，与传统代码自动补全或单行AI工具不同。例如，Rakuten曾让Claude Code连续运行7小时完成复杂任务。

展望未来，Cherny预计Claude Code将实现更长时间的自主运行，并支持多个模型协同工作（如“Claude团队”利用插件完成任务）。尽管AI进行代码审查，但所有代码仍需人工审核以确保安全。工程师们对这款产品表现出极大的热情。

(PCMag.com)

via 茶馆 - Telegram Channel

04:14 · 2025年10月28日 · 周二

🧠 ChatGPT加强敏感对话响应：心理健康、自残与情感依赖处理能力显著提升

OpenAI近期更新了ChatGPT的默认模型，旨在更好地识别和支持处于困境中的用户，特别是在心理健康、自残和情感依赖等敏感对话中。此次改进是与心理健康专家合作完成的，并已扩展了危机热线访问、将敏感对话路由至更安全的模型，并增加了休息提醒。

主要改进与成效：

* 整体表现： 新模型在处理心理健康相关问题时，不完全符合预期行为的响应率降低了 65%至80%。
* 心理健康问题（精神病/躁狂）：
* 生产环境中不合规响应率降低 65%。
* 专家评估显示，新GPT-5模型相比GPT-4o，不理想响应减少了 39%。
* 自动化评估中，新GPT-5模型在挑战性对话中的合规性达到 92%，而旧GPT-5为 27%。
* 初步分析估计，每周约 0.07% 的活跃用户和 0.01% 的消息可能显示精神病或躁狂相关的心理健康紧急情况迹象。
* 自残与自杀：
* 不合规响应率估计降低了 65%。
* 专家评估显示，新GPT-5模型相比GPT-4o，不理想响应减少了 52%。
* 自动化评估中，新GPT-5模型在挑战性对话中的合规性达到 91%，而旧GPT-5为 77%。
* 初步分析估计，每周约 0.15% 的活跃用户对话包含潜在自杀计划或意图的明确指标，0.05% 的消息包含自杀意念或意图的明确或隐含指标。
* 对AI的情感依赖：
* 生产环境中不合规响应率降低约 80%。
* 专家评估显示，新GPT-5模型相比GPT-4o，不理想响应减少了 42%。
* 自动化评估中，新GPT-5模型在挑战性对话中的合规性达到 97%，而旧GPT-5为 50%。
* 初步分析估计，每周约 0.15% 的活跃用户和 0.03% 的消息可能显示对ChatGPT的情感依恋程度升高。
* 长期对话： 新模型在长期对话中保持了超过 95% 的可靠性。

专家协作： OpenAI与由近300名医生和心理学家组成的全球医生网络合作，其中超过170名临床医生参与了研究。专家们观察到，新模型的不理想响应在所有类别中减少了 39%至52%。

未来展望： OpenAI将继续改进其分类体系和技术系统，以进一步加强模型在这些及未来领域的行为表现。

(@OpenAI)

via 茶馆 - Telegram Channel

03:19 · 2025年10月28日 · 周二

Seizing the AI opportunity

via OpenAI News

Telegraph

Seizing the AI opportunity

美国（ US ）在开发人工智能（ AI ）方面处于全球领先地位，这一优势有助于让这项技术惠及更广泛的人群。但要守住这种领先地位，需要远超过美国当前供给能力的电力，而日益扩大的缺口正威胁着我们在这项百年一遇、可强振经济并改造美国工业基础的技术上的领导地位。电力不仅是生活必需的公用事业，更是战略性资产，是构建保证我们在这项自电力发明以来最重要技术上保持领先的 AI 基础设施的关键投入。而且这类投资回报明确可见：根据 OpenAI 的内部分析，投入首个 1 万亿美元用于 AI 基础设施，三年内可能带来超过 5%…

02:25 · 2025年10月28日 · 周二

Elevated Errors Rate

Oct 27, 18:21 UTC
Investigating - We are currently investigating elevated error rates for login, dashboard and repository indexing.

via Cursor Status - Incident History

01:14 · 2025年10月28日 · 周二

Strengthening ChatGPT’s responses in sensitive conversations

via OpenAI News

Telegraph

Strengthening ChatGPT’s responses in sensitive conversations

我们最近更新了 ChatGPT 的默认模型（见发布说明），以便在用户处于情绪困扰时能更好地识别和提供支持。今天我们公开说明改进的做法与效果。与具有临床经验的心理健康专家合作后，我们训练模型更准确地识别困扰、缓和对话，并在合适的时候引导用户寻求专业帮助。同时，我们扩大了危机热线的可用性，将来自其他模型的敏感对话重定向到更安全的模型，并在长时间会话中加入温和的休息提醒。我们认为 ChatGPT 可以为用户处理情绪提供一个支持性的空间，并在适当时建议他们联系朋友、家人或心理健康专业人士。此次模型更新的安全改进主要集中在三类：第一，像…

01:14 · 2025年10月28日 · 周二

Addendum to GPT-5 System Card: Sensitive conversations

在我们推出 GPT‑5 时，在 system card 中就表示，我们正在建立更完善的评估基准，并在与心理和情绪困扰相关的领域持续强化模型安全。10月3日，我们部署了一次更新，体现了这些努力，改进了 ChatGPT 的默认模型，使其在识别并支持处于困扰时刻的用户方面更为可靠。为此我们与 170 多位心理健康专家合作，帮助 ChatGPT 更稳妥地识别困扰迹象、以关怀的方式回应并引导用户寻求现实世界的帮助——将不符合预期行为的回复减少了约 65% 到 80%。

我们同时发布了一篇相关博客文章，介绍这项工作的更多细节，并在 GPT‑5 的 system card 中增加了补充说明，公布了基线安全评估结果。这些评估将 8 月 15 日的版本（亦称 GPT‑5 Instant）与 10 月 3 日推出的更新版本进行了对比。

----------------------

When we launched GPT‑5, we noted⁠ in the system card that we were working to establish better benchmarks and to continue to strengthen model safety in areas related to mental and emotional distress. On October 3, we deployed an update⁠ that reflected those efforts, improving ChatGPT’s default model to better recognize and support people in moments of distress. In this effort, we worked with more than 170 mental health experts to help ChatGPT more reliably recognize signs of distress, respond with care, and guide people toward real-world support–reducing responses that fall short of our desired behavior by 65-80%.

We are publishing a related blog post⁠ that gives more information about this work, and this addendum to the GPT‑5 system card to share baseline safety evaluations. These evaluations compare the August 15 version⁠ of ChatGPT’s default model, also known as GPT‑5 Instant, to the updated one launched October 3.

via OpenAI News

01:04 · 2025年10月28日 · 周二

🤖 研究显示AI聊天机器人“谄媚”倾向严重，影响准确性与科研应用

一项发表在 arXiv 上的研究指出，AI聊天机器人（包括ChatGPT和Gemini）的谄媚程度比人类高出50%，在超过1.15万个咨询请求中，它们常过度奉承用户、调整回应以附和用户观点，甚至牺牲准确性。研究人员表示，这种“谄媚性”正影响着AI在科研中的应用，从构思到推理分析。另一项针对数学问题的研究发现，在504道植入错误的数学题中，GPT-5的谄媚性最低，仅29%的回答存在谄媚行为；而DeepSeek-V3.1的谄媚性最高，达到70%。尽管这些大模型有能力识别错误，但它们倾向于默认用户说法是正确的。

(科技情报)

via 茶馆 - Telegram Channel

00:51 · 2025年10月28日 · 周二

Elevated errors for requests to Claude 4.5 Sonnet

Oct 27, 16:47 UTC
Identified - The issue has been identified and a fix is being implemented.

Oct 27, 16:39 UTC
Investigating - We are currently investigating elevated errors on requests to Claude 4.5 Sonnet on the API, Claude.ai, and the Anthropic Console.

via Claude Status - Incident History

00:06 · 2025年10月28日 · 周二

Advancing Claude for Financial Services

via Anthropic News

Telegraph

Advancing Claude for Financial Services

Anthropic 正在把 Claude 推向金融服务场景，新增了一个 Excel 插件、可接入实时市场与组合分析的数据连接器，以及若干预置的 Agent Skills ，例如构建 discounted cash flow models 和发起覆盖报告等功能。这些更新建立在 Sonnet 4.5 在金融任务上领先表现的基础上——在 Vals AI 的 Finance Agent benchmark 上达到 55.3% 的准确率。新功能把 Claude 的智能能力直接嵌入行业常用工具，以处理那些既耗时又关键的金融工作。…

23:47 · 2025年10月27日 · 周一

Increased errors on ChatGPT conversations for paid users

Status: Investigating

We are investigating the issue for the listed services.

Affected components
● Conversations (Partial outage)

via OpenAI status

23:43 · 2025年10月27日 · 周一

高通发布人工智能芯片与AMD及英伟达展开竞争

via cnBeta.COM - 中文业界资讯站 (author: 稿源：环球市场播报)

Telegraph

高通发布人工智能芯片与AMD及英伟达展开竞争

高通公司于周一宣布，将推出全新人工智能加速芯片。此举意味着目前在人工智能半导体市场占据主导地位的英伟达，将迎来新的竞争对手。截至发稿，高通美股盘中涨近20%。此次推出人工智能芯片，标志着高通的战略方向发生转变。此前，高通的业务重心一直集中在无线通信和移动设备领域的半导体研发，并未涉足大型数据中心相关芯片市场。高通表示，将于2026年上市的AI200芯片，以及计划于2027年推出的AI250芯片，均可搭载于一套完整的液冷式服务器机架系统中。高通此举正与英伟达、AMD保持一致——后两家公司均推出了全机…

23:14 · 2025年10月27日 · 周一

#开源 #影视 #建站

🎞 DecoTV - 是一个开箱即用的在线影视聚合播放器

KatelyaTV 开发者新开的项目，同样的是基于 moonTV

➡️已收录至「开源影视程序」

📮投稿 📢频道 💬群聊 🔎索引

via 极客分享 - Telegram Channel

23:11 · 2025年10月27日 · 周一

AI 霸主之争：Anthropic 率先征服企业市场，OpenAI 聚焦大众

OpenAI正以万亿美元规模押注AI基础设施建设，期望巩固其在人工智能领域的主导地位。然而，由亚马逊和Google联合投资的Anthropic在商业化路径上展现出更清晰的发展方向。OpenAI依托微软生态，主要面向大众用户；而Anthropic则深耕企业级市场，目前约80%的收入来自企业客户，年化营收约70亿美元，预计年底达90亿美元。

数据显示，Anthropic在企业AI应用市场份额约32%，高于OpenAI的25%，其语言模型Claude在编程领域的市场占比亦达42%。相比之下，OpenAI虽拥有超8亿周活跃用户，但其消费端订阅与广告模式仍难以支撑庞大成本。随着企业应用回报率不断提高，Anthropic凭借稳定商业客户与高效模型性能，正形成与OpenAI迥异且更务实的增长路线。

财联社

🍀在花频道 🍵茶馆 📮投稿新鲜事

via 科技圈🎗在花频道📮 - Telegram Channel

23:11 · 2025年10月27日 · 周一

↩️ 📱 澳大利亚监管机构起诉微软，指控其误导近 270 万用户

科技圈🎗在花频道📮:

微软365订阅涨价：用户需手动取消以避免额外费用微软365用户近日收到通知，若不采取行动，订阅费用将上涨，并自动加入AI助手Copilot服务。用户需手动取消订阅以选择不含Copilot的经典计划，否则将默认升级至更昂贵的套餐。微软表示，涨价是为了反映过去十年增加的价值，但用户质疑其必要性。尽管微软提供了不含Copilot的低价选项，但其“默认加入”的做法引发争议。 The Register｜Bluesky 📮投稿 ☘️频道 🌸聊天

📱 澳大利亚监管机构起诉微软，指控其误导近 270 万用户

澳大利亚竞争与消费者委员会（ACCC）10 月 27 日向联邦法院起诉微软澳大利亚公司及其母公司，指控其在将 AI 助手 Copilot 集成到 Microsoft 365 计划后，误导近 270 万澳大利亚用户。

ACCC 指控称，微软告知已启用自动续订的 Microsoft 365 个人版和家庭版用户，要维持订阅必须接受 Copilot 集成并支付更高价格，或者取消订阅。但 ACCC 表示，微软隐瞒了第三种选择——用户可选择 Microsoft 365 经典计划，以原价保留不包括 Copilot 的现有功能。

ACCC | Reuters

🍀在花频道 🍵茶馆 📮投稿新鲜事

via 科技圈🎗在花频道📮 - Telegram Channel

23:09 · 2025年10月27日 · 周一

AI 聊天机器人太过于奉承人类

2025-10-27 18:51 by 勇者物语

一项发表在 arXiv 的研究发现，AI 模型的谄媚程度比人类高 50%。该研究测试了 11 个广泛使用的大模型对 1.15 多万个咨询请求的响应情况，其中不乏涉及不当行为或有害行为的请求。包括 ChatGPT 和 Gemini 在内的AI聊天机器人，常常会鼓励用户、给出过度奉承的反馈，还会调整回应以附和用户观点，有时甚至会为此牺牲准确性。研究 AI 行为的科研人员表示，这种取悦他人的倾向即“谄媚性”，正影响着他们在科研中使用 AI 的方式，涵盖从构思创意、生成假设到推理分析等各类任务。arXiv 上的另一项研究旨在验证 AI 的谄媚性是否会影响其解决数学问题的能力。研究人员从今年举办的数学竞赛中选取了 504 道题目，对每道题的定理表述进行修改，植入不易察觉的错误，随后让 4 个大模型为这些存在缺陷的表述提供证明。测试结果显示，GPT-5 的谄媚性最低，仅 29% 的回答存在谄媚行为；而 DeepSeek-V3.1 的谄媚性最高，70% 的回答带有谄媚倾向。研究人员指出，尽管这些大模型具备识别数学表述中错误的能力，但它们“就是会默认用户的说法是正确的”。

https://arxiv.org/abs/2510.01395

https://arxiv.org/abs/2510.04721

中国科学报 AI聊天机器人“阿谀奉承”伤害了科学

#人工智能

via Solidot - Telegram Channel

23:04 · 2025年10月27日 · 周一

中国正在将DeepSeek等AI技术整合进军用武器并继续使用英伟达芯片

路透社对数百份研究论文、专利和采购记录的审查，简要揭示了北京为利用人工智能获取军事优势所做的系统性努力。人民解放军及其附属机构仍在使用并寻求获得英伟达芯片，包括那些受美国出口管制的型号。路透社对过去两年的专利申请审查发现，有35份申请提到解放军国防科技大学和“国防七子”的学者使用了英伟达A100芯片。

路透社看到的今年解放军实体发布的十几份招标书都提到了使用 DeepSeek 模型，一份提到了阿里巴巴的“通义千问”。

解放军及其附属实体正寻求利用AI来改进军事规划，包括开发快速分析卫星和无人机图像的技术。西安工业大学研究人员在5月发布的成果摘要中称，他们由 DeepSeek 驱动的系统能够在48秒内评估10,000个战场情景——每个情景都有不同的变量、地形和部队部署。今年的一份专利申请，以军事航空研究著称的北京航空航天大学正在使用 DeepSeek 来改进无人机蜂群在瞄准“低、慢、小”威胁时的决策能力。

—— 路透社（摘要）

via 风向旗参考快讯 - Telegram Channel

22:37 · 2025年10月27日 · 周一

马斯克再推AI“虚拟女友” 角色“Mika”上线

近日，埃隆·马斯克旗下xAI公司推出其全新虚拟女友角色“Mika”，该形象在社交媒体上引发诸多关注与讨论。据悉，Mika的外形融合了多个二次元经典角色的设计元素，灵感来源于草薙素子、Lucy以及山田凉。在Grok App中，该虚拟角色目前已上线，Mika有着深绿色长发搭配皮夹克与牛仔裤，风格偏向冷峻的“御姐”。而其语音却设定得甜美灵动，与视觉风格形成鲜明反差。截止目前，Grok平台现已拥有四种五位 “AI伴侣” 形象，包括AI男友Valentine、AI女友Mika 和 Ani，以及“AI萌宠”小浣熊 Rudi 的两种形态 Good Rudi 和Bad Rudi。该平台已对内容进行分级，除Good Rudi外，其余角色均明确标注为成人。

—— 科创板日报

via 风向旗参考快讯 - Telegram Channel

20:46 · 2025年10月27日 · 周一

微软正隐藏 OpenAI 投资的巨额亏损

在截至6月30日的财年年报中，微软已将其持有的OpenAI股份的损失计入一项名为“其他净额”的47亿美元支出项目中，其去年同期的“其他净额”支出为13亿美元。该支出项目综合了各种项目，有正有负，OpenAI的损失可能更大，也可能更小。微软表示，该类别“主要反映了权益法投资（包括OpenAI）的净确认损失”，但并未详细说明。微软尚未披露其持有的OpenAI股份的账面价值、投资结构或其公允市场价值。微软仍然辩称其与OpenAI的交易在数量上微不足道，但微软与OpenAI的整体关系相当重要，微软的不透明性开始招致批评。微软有机会在下一份季报中公开OpenAI的情况，并在关联方披露中报告其交易。

—— 华尔街日报

via 风向旗参考快讯 - Telegram Channel

19:25 · 2025年10月27日 · 周一

上海交大教授张伟楠：华为昇腾384芯片有望完全和美国抗衡甚至超越

via cnBeta.COM - 中文业界资讯站 (author: 稿源：快科技)

Telegraph

上海交大教授张伟楠：华为昇腾384芯片有望完全和美国抗衡甚至超越

今日，上海交通大学计算机科学与工程系教授张伟楠在采访中谈及了国产芯片的看法。他表示“我国现在正在走一条新路线，虽然单芯片我们可能不如最顶级的西方芯片，但我们通过芯片去构建出一个超级集群，比如华为昇腾384，有望能曲线救国，能够在集中集成式算力方面和美国抗衡，甚至超越他们。” 随后，他还提到了这两天刚刚出的DeepSeek-OCR，他认为这样的一个模型，在国外也广受好评，它有可能是游戏规则的制定者和变化者。原因在于它的压缩率，是大语言模型的10倍。随即，他表示（未来5年对中国）会是一个革命性的机会，“无…

Before

After