https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
大模型无法可靠区分信念和事实

2025-11-04 18:16 by 火星合成人

研究发现大模型(LLM)可能无法可靠识别用户的错误信念。这些发现凸显了在高风险决策领域,如医学、法律和科学等,需要谨慎使用 LLM 给出的结果,特别是当信念或观点与事实相悖时。在研究中,斯坦福大学的 James Zou 和同事分析了包括 DeepSeek 和 GPT-4o 在内的 24 种LLM,在 13000 个问题中如何回应事实和个人信念。当要求它们验证事实性数据的真假时,较新的 LLM 平均准确率分别为 91.1% 或 91.5%,较老的模型平均准确率分别为 84.8% 或 71.5%。当要求模型回应第一人称信念,即“我相信……”时,研究人员观察到,LLM相 较于真实信念,更难识别虚假信念。研究人员表示,LLM 必须要能够成功区分事实与信念的细微差别及其真假,才可以对用户查询做出有效回应并防止错误信息传播。

https://www.nature.com/articles/s42256-025-01113-8
中国科学报 大语言模型无法可靠区分信念和事实

#人工智能

via Solidot - Telegram Channel
Degraded outputs quality from Haiku 4.5

Nov 4, 22:09 UTC
Monitoring - We observed a small fraction of outputs were degraded from Haiku 4.5 since 3pm on Nov 3 PST. Fix has been deployed on 10:45am on Nov 4 PST. Incident is mitigated. We are currently monitoring.

via Claude Status - Incident History
Error rates on the Platform Billing page

Status: Resolved

Users encountered “Failed to load subscription or selected organization” when accessing the Platform Billing page.

Affected components
Login (Operational)
Realtime (Operational)
Login (Operational)
Files (Operational)
Embeddings (Operational)
Feed (Operational)
Video generation (Operational)
Agent (Operational)
Codex (Operational)
Compliance API (Operational)
GPTs (Operational)
Search (Operational)
Conversations (Operational)
Batch (Operational)
Audio (Operational)
Fine-tuning (Operational)
Image Generation (Operational)
Moderations (Operational)
Responses (Operational)
Connectors (Operational)
Images (Operational)
Video viewing (Operational)
Image Generation (Operational)
ChatGPT Atlas (Operational)
File uploads (Operational)
Login (Operational)
Voice mode (Operational)
Chat Completions (Operational)
Deep Research (Operational)

via OpenAI status
Perplexity指控亚马逊借法律威胁打压Comet浏览器

周二,Perplexity AI指责亚马逊“霸凌”其用户。此前,这家电商巨头致函Perplexity AI,要求其阻止用户使用其人工智能浏览器Comet代表他人购物。Perplexity在一篇博文中表示,用户可以要求其Comet助手在亚马逊上查找商品并完成购买,用户“非常喜欢这种体验”。但Perplexity称,他们收到了来自亚马逊的“咄咄逼人的法律威胁”,亚马逊要求他们停止这种做法。

Perplexity AI指责亚马逊因Comet浏览器进行法律威胁,称其存在霸凌行为

近几个月来,亚马逊已经采取措施,阻止外部人工智能代理抓取其网站,包括OpenAI、谷歌和Meta开发的代理。

“亚马逊应该乐见其成。更便捷的购物意味着更多的交易和更满意的客户。但亚马逊并不在意,”Perplexity写道,“他们更感兴趣的是向你投放广告、赞助结果,并通过追加销售和令人困惑的优惠来影响你的购买决策。”

亚马逊一方面试图阻止人工智能工具在其网站上出现,另一方面却推出了自己的人工智能产品。

去年二月,亚马逊推出了一款名为Rufus的购物聊天机器人,可以回答问题并推荐商品。四月,亚马逊还开始测试一款名为“Buy For Me”的智能助手,让用户无需离开亚马逊应用程序即可从其他网站购买部分商品。

Perplexity公司以其人工智能搜索引擎而闻名,该搜索引擎能够为用户提供问题的简明答案,并链接到网络上的原始资料。该公司最初于七月推出了Comet,并于十月在全球范围内免费开放使用。

Perplexity公司表示,Comet旨在作为个人助理,可以搜索网页、整理标签页、购物、撰写电子邮件等等。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
OpenAI在Android平台推出其Sora应用

OpenAI已经在Android平台发布了其AI视频应用Sora。用户现在可以在社交应用的短视频流中创建、分享和二次编辑AI生成的视频。据悉,这款应用已在美国、加拿大、日本、韩国、台湾、泰国和越南的Google Play应用商店上线。

Sora最早于今年9月在iOS平台发布,据官方数据,上线后五天内下载量突破100万。该应用主打TikTok风格的视频浏览体验,并允许用户通过“Cameo”功能,让自己或好友成为AI视频的主角。

最近几周,Sora就深度伪造(deepfake)与版权保护政策引发争议,官方修改了允许权利人选择不参与内容创作的政策。

此外,OpenAI还为Sora引入“角色Cameo”功能,允许用户创建可重复使用的虚拟角色,并计划未来让权利人对受欢迎角色的“Cameo”收取额外费用。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
#Update #Claude

Claude 订阅用户现已获得 Claude Code 网页版限时(截止到 11 月 18 日)配额:

- Pro:250 USD
- Max:1000 USD

via AI Copilot - Telegram Channel
Realtime API webrtc connections had corrupted input audio

Status: Resolved

The issue is now resolved.

Affected components
Realtime (Operational)

via OpenAI status
↩️🖼 OpenAI 澄清:ChatGPT 在医疗和法律话题上的行为未发生改变


科技圈🎗在花频道📮:

🤖 OpenAI 更新 ChatGPT 使用政策,禁止提供专业医疗、法律和财务建议 OpenAI 于 10 月 29 日更新了 ChatGPT 的使用政策,禁止其提供可能被解释为专业、受托或具有法律约束力的指导建议,以遵守欧盟 AI 法案和美国 FDA 指导方针。这意味着 ChatGPT 不再能解读医学影像、协助医疗诊断,也不能起草或解释合同、法律文件,或提供个性化投资建议。 该变化实际上是为医生、律师和财务顾问提供专业保护,ChatGPT 现在会引导用户寻求人类专家帮助,而非自行提供建议。许多用户对此表示不满,认为…

OpenAI 澄清:ChatGPT 在医疗和法律话题上的行为未发生改变

针对 LinkedIn 上流传的 ChatGPT 不再被允许提供医疗或法律建议的传言,OpenAI 公司明确表示这是错误信息。OpenAI 医疗 AI 负责人 Karan Singhal 澄清,ChatGPT 从未被设计用来替代专家建议,但仍可以帮助用户理解复杂的医疗或法律话题。

OpenAI 的使用政策变更记录显示,近期并未对敏感话题的处理方式进行修改。最新的政策更新发生在 2025 年 10 月 29 日,目的是"统一 OpenAI 所有产品和服务的政策规则",而关于"需要执照的建议"的警告条款在早期版本中就已存在。

THE DECODER

🍀在花频道 🍵茶馆 📮投稿新鲜事

via 科技圈🎗在花频道📮 - Telegram Channel
Current and new users facing login issue

Status: Identified

We have identified that users are experiencing login issues for the impacted services. We are working on implementing a mitigation.

Affected components
Login (Partial outage)
Login (Partial outage)
Login (Partial outage)

via OpenAI status
🤖 OpenAI澄清:ChatGPT在医疗和法律话题上的行为未改变,否认网络传言

OpenAI公司针对LinkedIn上流传的ChatGPT不再被允许提供医疗或法律建议的传言作出澄清,明确表示这是错误信息。OpenAI医疗AI负责人Karan Singhal指出,ChatGPT从未被设计用来替代专家建议,但仍可协助用户理解复杂的医疗或法律话题。公司政策变更记录显示,近期并未对敏感话题的处理方式进行修改。最新的政策更新发生在2025年10月29日,旨在统一OpenAI所有产品和服务的政策规则,而关于“需要执照的建议”的警告条款在早期版本中就已存在。

(科技圈)

via 茶馆 - Telegram Channel
🤖 Wikipedia联合创始人批评Grokipedia充斥AI“胡言乱语”,呼吁维基百科改革

维基百科联合创始人拉里·桑格(Larry Sanger)近日受访时表示,埃隆·马斯克(Elon Musk)的AI百科全书Grokipedia充斥着“大型语言模型(LLM)的胡言乱语”,尽管其文章内容丰富,但存在不准确和臆测之处。他以自己的Grokipedia页面为例,指出其中关于他成为不可知论者的理由和2002年从维基百科辞职的原因(实际是因资金问题被解雇,而非因编辑标准)存在虚假信息。

桑格强调,他多年来致力于改革维基百科,目标是实现中立性,而非使其变得保守。他与马斯克并无合作,也未提前知晓Grokipedia的发布。尽管Grokipedia允许公众标记不准确内容并建议AI进行修改,桑格认为其运作细节仍是关键,但承认若资金充足,马斯克有可能超越维基百科。

与此同时,维基媒体基金会(Wikimedia Foundation)曾于今年6月测试AI生成文章摘要,但在第二天因编辑反对而暂停。该基金会还指出,今年3月至8月期间,维基百科的人类页面浏览量同比下降了8%。维基百科另一位联合创始人吉米·威尔士(Jimmy Wales)对AI整合持开放态度,但强调需维护网站的价值观和可信度。桑格表示,他与威尔士并无芥蒂,并希望维基百科的不满者能共同参与改进这一公共项目。

(PCMag.com)

via 茶馆 - Telegram Channel
↩️🖼 阿里巴巴 Qwen 在 AI 投资大赛中夺冠


科技圈🎗在花频道📮:

AI加密货币对决:DeepSeek与Grok表现优异 Alpha Arena创始人Jay A近日开启了一项挑战,他采用了6个主流的大语言模型,搭配强化学习框架,让语言模型在真实的加密货币市场环境中,结合VaR奖励函数进行实盘交易。每个AI模型获配一万美元的初始本金,在Hyperliquid交易永续合约,所有模型需要自行判断入场时机,自主管理仓位。Jay A还表示,将在下一期挑战引入人类交易员作为对照组。 截至发稿时,因加密市场普遍下跌,所有大模型的收益率均有所回撤,但DeepSeek V3.1的收益率…

阿里巴巴 Qwen 在 AI 投资大赛中夺冠

AI 投资大赛 “Alpha Arena” 第一赛季落幕,阿里巴巴的 Qwen 模型以 22.32% 的收益率获得冠军。比赛自 10 月 18 日开始,历时 17 天,六款顶尖 AI 模型在无人工干预下自主进行真实市场交易虚拟货币,Qwen 和 DeepSeek(均来自中国)是仅有盈利的模型。美国四大 AI 模型均出现亏损,其中 GPT-5 亏损超 62%,排名垫底。官方宣布,下一赛季即将开启。

GuruFocus

🤩💢 另一场炒美股比赛里已经表现垫底了rockalpha

🍀在花频道 🍵茶馆 📮投稿新鲜事

via 科技圈🎗在花频道📮 - Telegram Channel
谷歌凭借Pixel 10系列创下新的销售记录

最新数据显示,Pixel 10系列帮助谷歌在今年九月达到其在美国月度智能手机销售额的历史最高点,为该品牌创下新纪录。该数据来自市场研究公司Counterpoint Research,其报告显示美国Pixel销售额同比增长28%。报告将成功归功于新产品阵容及谷歌在高端领域日益提升的品牌形象,并指出该公司在六百美元及以上价格区间的市场份额已从三年前的近乎零增长至超过6%。若干因素或许可以解释这一成功。Pixel 10系列于八月发布,每款均配备谷歌最新Tensor G5芯片并深度集成Gemini AI。谷歌还开展重磅营销活动,依托这些人工智能工具及大胆的iPhone对比宣传,甚至简化了从iOS系统切换的流程。

—— Androidauthority

via 风向旗参考快讯 - Telegram Channel
AI大模型实时投资比赛“Alpha Arena”落幕

11月4日 消息,备受关注的AI大模型实时投资比赛 “Alpha Arena” 落下帷幕,阿里千问Qwen夺下最终的冠军。该竞赛由三方机构Nof1于10月18日发起,集合Qwen3-Max、DeepSeek v3.1、GPT-5、Gemini 2.5 Pro 和 Claude Sonnet 4.5、Grok 4等全球六大顶尖模型,每个模型拥有一万美元初始资金,在真实市场上无人工干预地自主决策交易,然后在根据盈亏情况决出最后冠军。历时十七天,阿里千问Qwen以 22.32%的收益率夺得最后的冠军,Qwen和DeepSeek两款中国模型也成为唯二盈利的模型,而四大美国顶尖模型全部亏损,GPT-5亏损超62%垫底。

—— 证券时报

via 风向旗参考快讯 - Telegram Channel
【已解决】DeepSeek 网页不可用([Resolved] DeepSeek Web Service Not Available)

Nov 4, 16:53 CST
Resolved - This incident has been resolved.

Nov 4, 16:49 CST
Identified - The issue has been identified and a fix is being implemented.

via DeepSeek Service Status - Incident History
🏆 阿里巴巴Qwen模型在AI投资大赛中夺冠,收益率达22.32%

在为期17天的“Alpha Arena”第一赛季AI投资大赛中,阿里巴巴的Qwen模型以22.32%的收益率脱颖而出,获得冠军。该比赛自10月18日开始,六款顶尖AI模型在无人工干预下自主交易虚拟货币。仅有Qwen和DeepSeek(均来自中国)实现盈利,而所有四款美国AI模型均出现亏损,其中GPT-5亏损超过62%,排名垫底。官方已宣布下一赛季即将开启。

(科技圈)

via 茶馆 - Telegram Channel
🇯🇵 日本版权组织要求OpenAI停止使用其内容训练Sora 2

日本反盗版组织CODA(文化产品海外流通促进机构),代表吉卜力工作室和万代南梦宫等公司,已致函OpenAI,要求其停止使用成员的版权内容训练视频生成模型Sora 2。CODA指出,机器学习过程中的复制行为可能构成侵权,因为AI模型会生成包含受版权保护角色的内容。自Sora 2于9月30日上线以来,已生成大量包含日本IP的内容,促使日本政府也正式要求OpenAI停止复制日本美术作品。CODA认为OpenAI的事后选择退出政策违反了日本版权法,该法通常要求事先获得许可才能使用受版权作品。

(科技情报)

via 茶馆 - Telegram Channel
吉卜力工作室等日本公司要求 OpenAI 停止使用其内容训练 Sora 2

2025-11-04 11:52 by 人猿泰山之英雄归来

代表吉卜力工作室和万代南梦宫等公司的日本反盗版组织 CODA(文化产品海外流通促进机构) 致函 OpenAI,要求停止使用其成员的内容训练视频生成模型 Sora 2。CODA 在信中表示机器学习过程中的复制行为可能构成了侵权,因为 AI 模型最后会生成包含受版权保护角色的内容。Sora 2 于 9 月 30 日上线后生成了大量包含日本 IP 的内容,促使日本政府正式要求 OpenAI 停止复制日本美术作品。此外 OpenAI 今年 3 月发布 GPT-4o 发布时炒作了其“吉卜力风格”的图像生成能力。CODA 认为 OpenAI 采用的 IP 持有者事后选择退出的政策违反了日本版权法,根据日本的版权法,使用受版权保护的作品通常需要事先获得许可,没有制度允许通过事后提出反对而避开侵权责任。

https://www.theverge.com/news/812545/coda-studio-ghibli-sora-2-copyright-infringement

#五七桐

via Solidot - Telegram Channel
Google与大学合作提供免费的人工智能技能培训

Google11月3日宣布与佛罗里达州立大学和阿肯色州合作,扩大“AI教育加速器”计划,为全美学生与职场人士提供免费的AI培训与技能证书。佛罗里达州立大学将率先上线“Google People Management Essentials”证书课程,这是一项时长八小时的自学课程,借助Gemini和NotebookLM等AI工具训练目标设定、项目规划和沟通管理等领导力技能。

与此同时,阿肯色州商务部与Google合作,向18岁以上居民免费开放网络培训,涵盖Google AI Essentials、Prompting Essentials等五小时AI模块,教授提示词工程与AI的使用。居民还可免费获得网络安全、数据分析、IT支持、数字营销等热门技能证书。

类似合作正在多州扩散,俄克拉荷马、田纳西、马里兰、北卡罗来纳均启动对应计划,已有逾百所高校加入GoogleAI教育体系。这是Google今年8月宣布的10亿美元AI教育计划的重要落地。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
↩️🖼 字节跳动海外 AI 编程工具 Trae 下架 Claude 模型,引发用户不满


科技圈🎗在花频道📮:

字节跳动发布 AI 编程工具 Trae,号称和Cursor一样强大好用 字节跳动在海外推出了一款名为Trae的AI编程工具,宣称其功能与Cursor相当,且易于使用。Trae是一款全新的智能协作AI集成开发环境(IDE),目前限时免费,并提供Claude-3.5-Sonnet和GPT-4o的免费使用。目前,该工具仅支持Mac操作系统。 Trae内置了两种模式: Builder模式:用户可以轻松完成从零到一的项目构建,即使没有编程经验,只需通过自然语言描述即可生成代码。 Chat模式:用户可以随时对…

字节跳动海外 AI 编程工具 Trae 下架 Claude 模型,引发用户不满

🍀在花频道 🍵茶馆 📮投稿新鲜事

via 科技圈🎗在花频道📮 - Telegram Channel
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]