https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
Addendum to GPT-5 System Card: Sensitive conversations
在我们推出 GPT‑5 时,在 system card 中就表示,我们正在建立更完善的评估基准,并在与心理和情绪困扰相关的领域持续强化模型安全。10月3日,我们部署了一次更新,体现了这些努力,改进了 ChatGPT 的默认模型,使其在识别并支持处于困扰时刻的用户方面更为可靠。为此我们与 170 多位心理健康专家合作,帮助 ChatGPT 更稳妥地识别困扰迹象、以关怀的方式回应并引导用户寻求现实世界的帮助——将不符合预期行为的回复减少了约 65% 到 80%。
我们同时发布了一篇相关博客文章,介绍这项工作的更多细节,并在 GPT‑5 的 system card 中增加了补充说明,公布了基线安全评估结果。这些评估将 8 月 15 日的版本(亦称 GPT‑5 Instant)与 10 月 3 日推出的更新版本进行了对比。
----------------------
When we launched GPT‑5, we noted in the system card that we were working to establish better benchmarks and to continue to strengthen model safety in areas related to mental and emotional distress. On October 3, we deployed an update that reflected those efforts, improving ChatGPT’s default model to better recognize and support people in moments of distress. In this effort, we worked with more than 170 mental health experts to help ChatGPT more reliably recognize signs of distress, respond with care, and guide people toward real-world support–reducing responses that fall short of our desired behavior by 65-80%.
We are publishing a related blog post that gives more information about this work, and this addendum to the GPT‑5 system card to share baseline safety evaluations. These evaluations compare the August 15 version of ChatGPT’s default model, also known as GPT‑5 Instant, to the updated one launched October 3.
via OpenAI News
在我们推出 GPT‑5 时,在 system card 中就表示,我们正在建立更完善的评估基准,并在与心理和情绪困扰相关的领域持续强化模型安全。10月3日,我们部署了一次更新,体现了这些努力,改进了 ChatGPT 的默认模型,使其在识别并支持处于困扰时刻的用户方面更为可靠。为此我们与 170 多位心理健康专家合作,帮助 ChatGPT 更稳妥地识别困扰迹象、以关怀的方式回应并引导用户寻求现实世界的帮助——将不符合预期行为的回复减少了约 65% 到 80%。
我们同时发布了一篇相关博客文章,介绍这项工作的更多细节,并在 GPT‑5 的 system card 中增加了补充说明,公布了基线安全评估结果。这些评估将 8 月 15 日的版本(亦称 GPT‑5 Instant)与 10 月 3 日推出的更新版本进行了对比。
----------------------
When we launched GPT‑5, we noted in the system card that we were working to establish better benchmarks and to continue to strengthen model safety in areas related to mental and emotional distress. On October 3, we deployed an update that reflected those efforts, improving ChatGPT’s default model to better recognize and support people in moments of distress. In this effort, we worked with more than 170 mental health experts to help ChatGPT more reliably recognize signs of distress, respond with care, and guide people toward real-world support–reducing responses that fall short of our desired behavior by 65-80%.
We are publishing a related blog post that gives more information about this work, and this addendum to the GPT‑5 system card to share baseline safety evaluations. These evaluations compare the August 15 version of ChatGPT’s default model, also known as GPT‑5 Instant, to the updated one launched October 3.
via OpenAI News
🤖 研究显示AI聊天机器人“谄媚”倾向严重,影响准确性与科研应用
一项发表在 arXiv 上的研究指出,AI聊天机器人(包括ChatGPT和Gemini)的谄媚程度比人类高出50%,在超过1.15万个咨询请求中,它们常过度奉承用户、调整回应以附和用户观点,甚至牺牲准确性。研究人员表示,这种“谄媚性”正影响着AI在科研中的应用,从构思到推理分析。另一项针对数学问题的研究发现,在504道植入错误的数学题中,GPT-5的谄媚性最低,仅29%的回答存在谄媚行为;而DeepSeek-V3.1的谄媚性最高,达到70%。尽管这些大模型有能力识别错误,但它们倾向于默认用户说法是正确的。
(科技情报)
via 茶馆 - Telegram Channel
一项发表在 arXiv 上的研究指出,AI聊天机器人(包括ChatGPT和Gemini)的谄媚程度比人类高出50%,在超过1.15万个咨询请求中,它们常过度奉承用户、调整回应以附和用户观点,甚至牺牲准确性。研究人员表示,这种“谄媚性”正影响着AI在科研中的应用,从构思到推理分析。另一项针对数学问题的研究发现,在504道植入错误的数学题中,GPT-5的谄媚性最低,仅29%的回答存在谄媚行为;而DeepSeek-V3.1的谄媚性最高,达到70%。尽管这些大模型有能力识别错误,但它们倾向于默认用户说法是正确的。
(科技情报)
via 茶馆 - Telegram Channel
Elevated errors for requests to Claude 4.5 Sonnet
Oct 27, 16:47 UTC
Identified - The issue has been identified and a fix is being implemented.
Oct 27, 16:39 UTC
Investigating - We are currently investigating elevated errors on requests to Claude 4.5 Sonnet on the API, Claude.ai, and the Anthropic Console.
via Claude Status - Incident History
Oct 27, 16:47 UTC
Identified - The issue has been identified and a fix is being implemented.
Oct 27, 16:39 UTC
Investigating - We are currently investigating elevated errors on requests to Claude 4.5 Sonnet on the API, Claude.ai, and the Anthropic Console.
via Claude Status - Incident History
Increased errors on ChatGPT conversations for paid users
Status: Investigating
We are investigating the issue for the listed services.
Affected components
● Conversations (Partial outage)
via OpenAI status
Status: Investigating
We are investigating the issue for the listed services.
Affected components
● Conversations (Partial outage)
via OpenAI status
🎞 DecoTV - 是一个开箱即用的在线影视聚合播放器
KatelyaTV 开发者新开的项目,同样的是基于 moonTV
➡️已收录至「开源影视程序」
📮投稿 📢频道 💬群聊 🔎索引
via 极客分享 - Telegram Channel
AI 霸主之争:Anthropic 率先征服企业市场,OpenAI 聚焦大众
OpenAI正以万亿美元规模押注AI基础设施建设,期望巩固其在人工智能领域的主导地位。然而,由亚马逊和Google联合投资的Anthropic在商业化路径上展现出更清晰的发展方向。OpenAI依托微软生态,主要面向大众用户;而Anthropic则深耕企业级市场,目前约80%的收入来自企业客户,年化营收约70亿美元,预计年底达90亿美元。
数据显示,Anthropic在企业AI应用市场份额约32%,高于OpenAI的25%,其语言模型Claude在编程领域的市场占比亦达42%。相比之下,OpenAI虽拥有超8亿周活跃用户,但其消费端订阅与广告模式仍难以支撑庞大成本。随着企业应用回报率不断提高,Anthropic凭借稳定商业客户与高效模型性能,正形成与OpenAI迥异且更务实的增长路线。
财联社
🍀在花频道 🍵茶馆 📮投稿新鲜事
via 科技圈🎗在花频道📮 - Telegram Channel
OpenAI正以万亿美元规模押注AI基础设施建设,期望巩固其在人工智能领域的主导地位。然而,由亚马逊和Google联合投资的Anthropic在商业化路径上展现出更清晰的发展方向。OpenAI依托微软生态,主要面向大众用户;而Anthropic则深耕企业级市场,目前约80%的收入来自企业客户,年化营收约70亿美元,预计年底达90亿美元。
数据显示,Anthropic在企业AI应用市场份额约32%,高于OpenAI的25%,其语言模型Claude在编程领域的市场占比亦达42%。相比之下,OpenAI虽拥有超8亿周活跃用户,但其消费端订阅与广告模式仍难以支撑庞大成本。随着企业应用回报率不断提高,Anthropic凭借稳定商业客户与高效模型性能,正形成与OpenAI迥异且更务实的增长路线。
财联社
🍀在花频道 🍵茶馆 📮投稿新鲜事
via 科技圈🎗在花频道📮 - Telegram Channel
↩️ 📱 澳大利亚监管机构起诉微软,指控其误导近 270 万用户
📱 澳大利亚监管机构起诉微软,指控其误导近 270 万用户
澳大利亚竞争与消费者委员会(ACCC)10 月 27 日向联邦法院起诉微软澳大利亚公司及其母公司,指控其在将 AI 助手 Copilot 集成到 Microsoft 365 计划后,误导近 270 万澳大利亚用户。
ACCC 指控称,微软告知已启用自动续订的 Microsoft 365 个人版和家庭版用户,要维持订阅必须接受 Copilot 集成并支付更高价格,或者取消订阅。但 ACCC 表示,微软隐瞒了第三种选择——用户可选择 Microsoft 365 经典计划,以原价保留不包括 Copilot 的现有功能。
ACCC | Reuters
🍀在花频道 🍵茶馆 📮投稿新鲜事
via 科技圈🎗在花频道📮 - Telegram Channel
科技圈🎗在花频道📮:
微软365订阅涨价:用户需手动取消以避免额外费用 微软365用户近日收到通知,若不采取行动,订阅费用将上涨,并自动加入AI助手Copilot服务。用户需手动取消订阅以选择不含Copilot的经典计划,否则将默认升级至更昂贵的套餐。 微软表示,涨价是为了反映过去十年增加的价值,但用户质疑其必要性。尽管微软提供了不含Copilot的低价选项,但其“默认加入”的做法引发争议。 The Register|Bluesky 📮投稿 ☘️频道 🌸聊天
📱 澳大利亚监管机构起诉微软,指控其误导近 270 万用户
澳大利亚竞争与消费者委员会(ACCC)10 月 27 日向联邦法院起诉微软澳大利亚公司及其母公司,指控其在将 AI 助手 Copilot 集成到 Microsoft 365 计划后,误导近 270 万澳大利亚用户。
ACCC 指控称,微软告知已启用自动续订的 Microsoft 365 个人版和家庭版用户,要维持订阅必须接受 Copilot 集成并支付更高价格,或者取消订阅。但 ACCC 表示,微软隐瞒了第三种选择——用户可选择 Microsoft 365 经典计划,以原价保留不包括 Copilot 的现有功能。
ACCC | Reuters
🍀在花频道 🍵茶馆 📮投稿新鲜事
via 科技圈🎗在花频道📮 - Telegram Channel
AI 聊天机器人太过于奉承人类
2025-10-27 18:51 by 勇者物语
一项发表在 arXiv 的研究发现,AI 模型的谄媚程度比人类高 50%。该研究测试了 11 个广泛使用的大模型对 1.15 多万个咨询请求的响应情况,其中不乏涉及不当行为或有害行为的请求。包括 ChatGPT 和 Gemini 在内的AI聊天机器人,常常会鼓励用户、给出过度奉承的反馈,还会调整回应以附和用户观点,有时甚至会为此牺牲准确性。研究 AI 行为的科研人员表示,这种取悦他人的倾向即“谄媚性”,正影响着他们在科研中使用 AI 的方式,涵盖从构思创意、生成假设到推理分析等各类任务。arXiv 上的另一项研究旨在验证 AI 的谄媚性是否会影响其解决数学问题的能力。研究人员从今年举办的数学竞赛中选取了 504 道题目,对每道题的定理表述进行修改,植入不易察觉的错误,随后让 4 个大模型为这些存在缺陷的表述提供证明。测试结果显示,GPT-5 的谄媚性最低,仅 29% 的回答存在谄媚行为;而 DeepSeek-V3.1 的谄媚性最高,70% 的回答带有谄媚倾向。研究人员指出,尽管这些大模型具备识别数学表述中错误的能力,但它们“就是会默认用户的说法是正确的”。
https://arxiv.org/abs/2510.01395
https://arxiv.org/abs/2510.04721
中国科学报 AI聊天机器人“阿谀奉承”伤害了科学
#人工智能
via Solidot - Telegram Channel
2025-10-27 18:51 by 勇者物语
一项发表在 arXiv 的研究发现,AI 模型的谄媚程度比人类高 50%。该研究测试了 11 个广泛使用的大模型对 1.15 多万个咨询请求的响应情况,其中不乏涉及不当行为或有害行为的请求。包括 ChatGPT 和 Gemini 在内的AI聊天机器人,常常会鼓励用户、给出过度奉承的反馈,还会调整回应以附和用户观点,有时甚至会为此牺牲准确性。研究 AI 行为的科研人员表示,这种取悦他人的倾向即“谄媚性”,正影响着他们在科研中使用 AI 的方式,涵盖从构思创意、生成假设到推理分析等各类任务。arXiv 上的另一项研究旨在验证 AI 的谄媚性是否会影响其解决数学问题的能力。研究人员从今年举办的数学竞赛中选取了 504 道题目,对每道题的定理表述进行修改,植入不易察觉的错误,随后让 4 个大模型为这些存在缺陷的表述提供证明。测试结果显示,GPT-5 的谄媚性最低,仅 29% 的回答存在谄媚行为;而 DeepSeek-V3.1 的谄媚性最高,70% 的回答带有谄媚倾向。研究人员指出,尽管这些大模型具备识别数学表述中错误的能力,但它们“就是会默认用户的说法是正确的”。
https://arxiv.org/abs/2510.01395
https://arxiv.org/abs/2510.04721
中国科学报 AI聊天机器人“阿谀奉承”伤害了科学
#人工智能
via Solidot - Telegram Channel
中国正在将DeepSeek等AI技术整合进军用武器并继续使用英伟达芯片
路透社对数百份研究论文、专利和采购记录的审查,简要揭示了北京为利用人工智能获取军事优势所做的系统性努力。人民解放军及其附属机构仍在使用并寻求获得英伟达芯片,包括那些受美国出口管制的型号。路透社对过去两年的专利申请审查发现,有35份申请提到解放军国防科技大学和“国防七子”的学者使用了英伟达A100芯片。
路透社看到的今年解放军实体发布的十几份招标书都提到了使用 DeepSeek 模型,一份提到了阿里巴巴的“通义千问”。
解放军及其附属实体正寻求利用AI来改进军事规划,包括开发快速分析卫星和无人机图像的技术。西安工业大学研究人员在5月发布的成果摘要中称,他们由 DeepSeek 驱动的系统能够在48秒内评估10,000个战场情景——每个情景都有不同的变量、地形和部队部署。今年的一份专利申请,以军事航空研究著称的北京航空航天大学正在使用 DeepSeek 来改进无人机蜂群在瞄准“低、慢、小”威胁时的决策能力。
—— 路透社(摘要)
via 风向旗参考快讯 - Telegram Channel
路透社对数百份研究论文、专利和采购记录的审查,简要揭示了北京为利用人工智能获取军事优势所做的系统性努力。人民解放军及其附属机构仍在使用并寻求获得英伟达芯片,包括那些受美国出口管制的型号。路透社对过去两年的专利申请审查发现,有35份申请提到解放军国防科技大学和“国防七子”的学者使用了英伟达A100芯片。
路透社看到的今年解放军实体发布的十几份招标书都提到了使用 DeepSeek 模型,一份提到了阿里巴巴的“通义千问”。
解放军及其附属实体正寻求利用AI来改进军事规划,包括开发快速分析卫星和无人机图像的技术。西安工业大学研究人员在5月发布的成果摘要中称,他们由 DeepSeek 驱动的系统能够在48秒内评估10,000个战场情景——每个情景都有不同的变量、地形和部队部署。今年的一份专利申请,以军事航空研究著称的北京航空航天大学正在使用 DeepSeek 来改进无人机蜂群在瞄准“低、慢、小”威胁时的决策能力。
—— 路透社(摘要)
via 风向旗参考快讯 - Telegram Channel
近日,埃隆·马斯克旗下xAI公司推出其全新虚拟女友角色“Mika”,该形象在社交媒体上引发诸多关注与讨论。据悉,Mika的外形融合了多个二次元经典角色的设计元素,灵感来源于草薙素子、Lucy以及山田凉。在Grok App中,该虚拟角色目前已上线,Mika有着深绿色长发搭配皮夹克与牛仔裤,风格偏向冷峻的“御姐”。而其语音却设定得甜美灵动,与视觉风格形成鲜明反差。截止目前,Grok平台现已拥有四种五位 “AI伴侣” 形象,包括AI男友Valentine、AI女友Mika 和 Ani,以及“AI萌宠”小浣熊 Rudi 的两种形态 Good Rudi 和Bad Rudi。该平台已对内容进行分级,除Good Rudi外,其余角色均明确标注为成人。
—— 科创板日报
via 风向旗参考快讯 - Telegram Channel
微软正隐藏 OpenAI 投资的巨额亏损
在截至6月30日的财年年报中,微软已将其持有的OpenAI股份的损失计入一项名为“其他净额”的47亿美元支出项目中,其去年同期的“其他净额”支出为13亿美元。该支出项目综合了各种项目,有正有负,OpenAI的损失可能更大,也可能更小。微软表示,该类别“主要反映了权益法投资(包括OpenAI)的净确认损失”,但并未详细说明。微软尚未披露其持有的OpenAI股份的账面价值、投资结构或其公允市场价值。微软仍然辩称其与OpenAI的交易在数量上微不足道,但微软与OpenAI的整体关系相当重要,微软的不透明性开始招致批评。微软有机会在下一份季报中公开OpenAI的情况,并在关联方披露中报告其交易。
—— 华尔街日报
via 风向旗参考快讯 - Telegram Channel
在截至6月30日的财年年报中,微软已将其持有的OpenAI股份的损失计入一项名为“其他净额”的47亿美元支出项目中,其去年同期的“其他净额”支出为13亿美元。该支出项目综合了各种项目,有正有负,OpenAI的损失可能更大,也可能更小。微软表示,该类别“主要反映了权益法投资(包括OpenAI)的净确认损失”,但并未详细说明。微软尚未披露其持有的OpenAI股份的账面价值、投资结构或其公允市场价值。微软仍然辩称其与OpenAI的交易在数量上微不足道,但微软与OpenAI的整体关系相当重要,微软的不透明性开始招致批评。微软有机会在下一份季报中公开OpenAI的情况,并在关联方披露中报告其交易。
—— 华尔街日报
via 风向旗参考快讯 - Telegram Channel
Gemini新功能:输入提示即可生成幻灯片
谷歌正在为Gemini助手的 Canvas 推出一项新功能,只需输入提示即可生成幻灯片。据悉,Canvas专为需要创建幻灯片的学生和员工打造。Gemini现在只需输入提示即可生成幻灯片,但如果用户需要基于特定来源的幻灯片,也可以上传文档、电子表格和研究论文等文件。生成的幻灯片将包含主题和图片以及文本。用户可以直接从Gemini应用将它们导出到谷歌幻灯片,并且仍然可以根据需要编辑和完善幻灯片,或与团队成员协作。
—— 环球网
via 风向旗参考快讯 - Telegram Channel
谷歌正在为Gemini助手的 Canvas 推出一项新功能,只需输入提示即可生成幻灯片。据悉,Canvas专为需要创建幻灯片的学生和员工打造。Gemini现在只需输入提示即可生成幻灯片,但如果用户需要基于特定来源的幻灯片,也可以上传文档、电子表格和研究论文等文件。生成的幻灯片将包含主题和图片以及文本。用户可以直接从Gemini应用将它们导出到谷歌幻灯片,并且仍然可以根据需要编辑和完善幻灯片,或与团队成员协作。
—— 环球网
via 风向旗参考快讯 - Telegram Channel
💸 AI伪造报销单泛滥,全球企业面临巨额损失与识别挑战
随着OpenAI和Google等公司推出新型图像生成AI模型,全球企业正面临员工利用AI伪造逼真报销单据的严重欺诈问题。费用管理平台AppZen报告称,今年9月提交的欺诈性文件中,AI伪造收据的比例已达14%,而去年这一比例为零。金融科技集团Ramp在90天内识别出逾100万美元的欺诈性发票。Medius调查显示,自GPT-4o发布后,约30%的英美财务专业人士发现伪造收据现象显著增加。SAP公司7月调研指出,近70%的首席财务官认为员工正利用AI伪造报销,其中约10%已确认公司发生此类事件。由于AI生成的假小票极其逼真,人工审核难以辨别,企业不得不转而使用AI技术,通过扫描图像元数据和分析上下文信息(如餐厅名称、时间、差旅模式)来识别欺诈。注册舞弊审查师协会指出,AI使欺诈门槛变得极低,无需专业技能即可实施。
(IT业界资讯)
via 茶馆 - Telegram Channel
随着OpenAI和Google等公司推出新型图像生成AI模型,全球企业正面临员工利用AI伪造逼真报销单据的严重欺诈问题。费用管理平台AppZen报告称,今年9月提交的欺诈性文件中,AI伪造收据的比例已达14%,而去年这一比例为零。金融科技集团Ramp在90天内识别出逾100万美元的欺诈性发票。Medius调查显示,自GPT-4o发布后,约30%的英美财务专业人士发现伪造收据现象显著增加。SAP公司7月调研指出,近70%的首席财务官认为员工正利用AI伪造报销,其中约10%已确认公司发生此类事件。由于AI生成的假小票极其逼真,人工审核难以辨别,企业不得不转而使用AI技术,通过扫描图像元数据和分析上下文信息(如餐厅名称、时间、差旅模式)来识别欺诈。注册舞弊审查师协会指出,AI使欺诈门槛变得极低,无需专业技能即可实施。
(IT业界资讯)
via 茶馆 - Telegram Channel
📈 AI市场双雄争霸:Anthropic深耕企业营收领先,OpenAI聚焦大众用户
OpenAI正以万亿美元规模押注AI基础设施建设,并依托微软生态主要面向大众用户。然而,由亚马逊和Google投资的Anthropic则在企业级市场展现出更清晰的商业化路径。Anthropic约80%的收入来自企业客户,年化营收约70亿美元,预计年底将达90亿美元。在企业AI应用市场,Anthropic的市场份额约32%,高于OpenAI的25%,其语言模型Claude在编程领域市场占比达42%。尽管OpenAI拥有超8亿周活跃用户,但其消费端订阅与广告模式仍难以支撑庞大成本。Anthropic凭借稳定的企业客户和高效模型性能,正形成一条与OpenAI迥异且更务实的增长路线。
(科技圈)
via 茶馆 - Telegram Channel
OpenAI正以万亿美元规模押注AI基础设施建设,并依托微软生态主要面向大众用户。然而,由亚马逊和Google投资的Anthropic则在企业级市场展现出更清晰的商业化路径。Anthropic约80%的收入来自企业客户,年化营收约70亿美元,预计年底将达90亿美元。在企业AI应用市场,Anthropic的市场份额约32%,高于OpenAI的25%,其语言模型Claude在编程领域市场占比达42%。尽管OpenAI拥有超8亿周活跃用户,但其消费端订阅与广告模式仍难以支撑庞大成本。Anthropic凭借稳定的企业客户和高效模型性能,正形成一条与OpenAI迥异且更务实的增长路线。
(科技圈)
via 茶馆 - Telegram Channel
中国正在利用 DeepSeek 和人工智能进行研究,以在与美国的军备竞赛中迎头赶上。中国军方正在探索诸如自主无人机蜂群和机器狗等技术。
(@Reuters China)
via 茶馆 - Telegram Channel
(@Reuters China)
via 茶馆 - Telegram Channel