https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
Addendum to GPT-5 System Card: Sensitive conversations

在我们推出 GPT‑5 时,在 system card 中就表示,我们正在建立更完善的评估基准,并在与心理和情绪困扰相关的领域持续强化模型安全。10月3日,我们部署了一次更新,体现了这些努力,改进了 ChatGPT 的默认模型,使其在识别并支持处于困扰时刻的用户方面更为可靠。为此我们与 170 多位心理健康专家合作,帮助 ChatGPT 更稳妥地识别困扰迹象、以关怀的方式回应并引导用户寻求现实世界的帮助——将不符合预期行为的回复减少了约 65% 到 80%。

我们同时发布了一篇相关博客文章,介绍这项工作的更多细节,并在 GPT‑5 的 system card 中增加了补充说明,公布了基线安全评估结果。这些评估将 8 月 15 日的版本(亦称 GPT‑5 Instant)与 10 月 3 日推出的更新版本进行了对比。

----------------------

When we launched GPT‑5, we noted in the system card that we were working to establish better benchmarks and to continue to strengthen model safety in areas related to mental and emotional distress. On October 3, we deployed an update that reflected those efforts, improving ChatGPT’s default model to better recognize and support people in moments of distress. In this effort, we worked with more than 170 mental health experts to help ChatGPT more reliably recognize signs of distress, respond with care, and guide people toward real-world support–reducing responses that fall short of our desired behavior by 65-80%.

We are publishing a related blog post that gives more information about this work, and this addendum to the GPT‑5 system card to share baseline safety evaluations. These evaluations compare the August 15 version of ChatGPT’s default model, also known as GPT‑5 Instant, to the updated one launched October 3.

via OpenAI News
🤖 研究显示AI聊天机器人“谄媚”倾向严重,影响准确性与科研应用

一项发表在 arXiv 上的研究指出,AI聊天机器人(包括ChatGPT和Gemini)的谄媚程度比人类高出50%,在超过1.15万个咨询请求中,它们常过度奉承用户、调整回应以附和用户观点,甚至牺牲准确性。研究人员表示,这种“谄媚性”正影响着AI在科研中的应用,从构思到推理分析。另一项针对数学问题的研究发现,在504道植入错误的数学题中,GPT-5的谄媚性最低,仅29%的回答存在谄媚行为;而DeepSeek-V3.1的谄媚性最高,达到70%。尽管这些大模型有能力识别错误,但它们倾向于默认用户说法是正确的。

(科技情报)

via 茶馆 - Telegram Channel
Elevated errors for requests to Claude 4.5 Sonnet

Oct 27, 16:47 UTC
Identified - The issue has been identified and a fix is being implemented.

Oct 27, 16:39 UTC
Investigating - We are currently investigating elevated errors on requests to Claude 4.5 Sonnet on the API, Claude.ai, and the Anthropic Console.

via Claude Status - Incident History
Increased errors on ChatGPT conversations for paid users

Status: Investigating

We are investigating the issue for the listed services.

Affected components
Conversations (Partial outage)

via OpenAI status
AI 霸主之争:Anthropic 率先征服企业市场,OpenAI 聚焦大众

OpenAI正以万亿美元规模押注AI基础设施建设,期望巩固其在人工智能领域的主导地位。然而,由亚马逊和Google联合投资的Anthropic在商业化路径上展现出更清晰的发展方向。OpenAI依托微软生态,主要面向大众用户;而Anthropic则深耕企业级市场,目前约80%的收入来自企业客户,年化营收约70亿美元,预计年底达90亿美元。

数据显示,Anthropic在企业AI应用市场份额约32%,高于OpenAI的25%,其语言模型Claude在编程领域的市场占比亦达42%。相比之下,OpenAI虽拥有超8亿周活跃用户,但其消费端订阅与广告模式仍难以支撑庞大成本。随着企业应用回报率不断提高,Anthropic凭借稳定商业客户与高效模型性能,正形成与OpenAI迥异且更务实的增长路线。

财联社

🍀在花频道 🍵茶馆 📮投稿新鲜事

via 科技圈🎗在花频道📮 - Telegram Channel
↩️ 📱 澳大利亚监管机构起诉微软,指控其误导近 270 万用户


科技圈🎗在花频道📮:

微软365订阅涨价:用户需手动取消以避免额外费用 微软365用户近日收到通知,若不采取行动,订阅费用将上涨,并自动加入AI助手Copilot服务。用户需手动取消订阅以选择不含Copilot的经典计划,否则将默认升级至更昂贵的套餐。 微软表示,涨价是为了反映过去十年增加的价值,但用户质疑其必要性。尽管微软提供了不含Copilot的低价选项,但其“默认加入”的做法引发争议。 The Register|Bluesky 📮投稿 ☘️频道 🌸聊天

📱 澳大利亚监管机构起诉微软,指控其误导近 270 万用户

澳大利亚竞争与消费者委员会(ACCC)10 月 27 日向联邦法院起诉微软澳大利亚公司及其母公司,指控其在将 AI 助手 Copilot 集成到 Microsoft 365 计划后,误导近 270 万澳大利亚用户。

ACCC 指控称,微软告知已启用自动续订的 Microsoft 365 个人版和家庭版用户,要维持订阅必须接受 Copilot 集成并支付更高价格,或者取消订阅。但 ACCC 表示,微软隐瞒了第三种选择——用户可选择 Microsoft 365 经典计划,以原价保留不包括 Copilot 的现有功能。

ACCC | Reuters

🍀在花频道 🍵茶馆 📮投稿新鲜事

via 科技圈🎗在花频道📮 - Telegram Channel
AI 聊天机器人太过于奉承人类

2025-10-27 18:51 by 勇者物语

一项发表在 arXiv 的研究发现,AI 模型的谄媚程度比人类高 50%。该研究测试了 11 个广泛使用的大模型对 1.15 多万个咨询请求的响应情况,其中不乏涉及不当行为或有害行为的请求。包括 ChatGPT 和 Gemini 在内的AI聊天机器人,常常会鼓励用户、给出过度奉承的反馈,还会调整回应以附和用户观点,有时甚至会为此牺牲准确性。研究 AI 行为的科研人员表示,这种取悦他人的倾向即“谄媚性”,正影响着他们在科研中使用 AI 的方式,涵盖从构思创意、生成假设到推理分析等各类任务。arXiv 上的另一项研究旨在验证 AI 的谄媚性是否会影响其解决数学问题的能力。研究人员从今年举办的数学竞赛中选取了 504 道题目,对每道题的定理表述进行修改,植入不易察觉的错误,随后让 4 个大模型为这些存在缺陷的表述提供证明。测试结果显示,GPT-5 的谄媚性最低,仅 29% 的回答存在谄媚行为;而 DeepSeek-V3.1 的谄媚性最高,70% 的回答带有谄媚倾向。研究人员指出,尽管这些大模型具备识别数学表述中错误的能力,但它们“就是会默认用户的说法是正确的”。

https://arxiv.org/abs/2510.01395

https://arxiv.org/abs/2510.04721

中国科学报 AI聊天机器人“阿谀奉承”伤害了科学

#人工智能

via Solidot - Telegram Channel
中国正在将DeepSeek等AI技术整合进军用武器并继续使用英伟达芯片

路透社对数百份研究论文、专利和采购记录的审查,简要揭示了北京为利用人工智能获取军事优势所做的系统性努力。人民解放军及其附属机构仍在使用并寻求获得英伟达芯片,包括那些受美国出口管制的型号。路透社对过去两年的专利申请审查发现,有35份申请提到解放军国防科技大学和“国防七子”的学者使用了英伟达A100芯片。

路透社看到的今年解放军实体发布的十几份招标书都提到了使用 DeepSeek 模型,一份提到了阿里巴巴的“通义千问”。

解放军及其附属实体正寻求利用AI来改进军事规划,包括开发快速分析卫星和无人机图像的技术。西安工业大学研究人员在5月发布的成果摘要中称,他们由 DeepSeek 驱动的系统能够在48秒内评估10,000个战场情景——每个情景都有不同的变量、地形和部队部署。今年的一份专利申请,以军事航空研究著称的北京航空航天大学正在使用 DeepSeek 来改进无人机蜂群在瞄准“低、慢、小”威胁时的决策能力。

—— 路透社(摘要)

via 风向旗参考快讯 - Telegram Channel
马斯克再推AI“虚拟女友” 角色“Mika”上线

近日,埃隆·马斯克旗下xAI公司推出其全新虚拟女友角色“Mika”,该形象在社交媒体上引发诸多关注与讨论。据悉,Mika的外形融合了多个二次元经典角色的设计元素,灵感来源于草薙素子、Lucy以及山田凉。在Grok App中,该虚拟角色目前已上线,Mika有着深绿色长发搭配皮夹克与牛仔裤,风格偏向冷峻的“御姐”。而其语音却设定得甜美灵动,与视觉风格形成鲜明反差。截止目前,Grok平台现已拥有四种五位 “AI伴侣” 形象,包括AI男友Valentine、AI女友Mika 和 Ani,以及“AI萌宠”小浣熊 Rudi 的两种形态 Good Rudi 和Bad Rudi。该平台已对内容进行分级,除Good Rudi外,其余角色均明确标注为成人。

—— 科创板日报

via 风向旗参考快讯 - Telegram Channel
微软正隐藏 OpenAI 投资的巨额亏损

在截至6月30日的财年年报中,微软已将其持有的OpenAI股份的损失计入一项名为“其他净额”的47亿美元支出项目中,其去年同期的“其他净额”支出为13亿美元。该支出项目综合了各种项目,有正有负,OpenAI的损失可能更大,也可能更小。微软表示,该类别“主要反映了权益法投资(包括OpenAI)的净确认损失”,但并未详细说明。微软尚未披露其持有的OpenAI股份的账面价值、投资结构或其公允市场价值。微软仍然辩称其与OpenAI的交易在数量上微不足道,但微软与OpenAI的整体关系相当重要,微软的不透明性开始招致批评。微软有机会在下一份季报中公开OpenAI的情况,并在关联方披露中报告其交易。

—— 华尔街日报

via 风向旗参考快讯 - Telegram Channel
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]