https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
孙正义豪赌OpenAI引发软银集团内部质疑
随着软银集团对OpenAI的投资承诺超过六百亿美元,一些软银内部人士开始对孙正义给予奥尔特曼的高度信任感到愈发不安。当软银去年开始向OpenAI投资数十亿美元时,部分高管曾向孙正义提出一个问题:如果这家ChatGPT开发商在极端情况下失败,该怎么办?据知情人士表示,孙正义曾多次驳回此类提问,而且态度常常很不耐烦,以至于他的下属们不再提及此事。孙正义曾表示,他相信奥尔特曼正在引领本世纪最重要的技术变革。而这些知情人士提到的一个关键担忧是,孙正义将软银集团过多的资本集中投入到一家公司身上,尤其是这家公司最近还面临商业、声誉和法律等多重问题。
—— 凤凰网科技、彭博社
via 风向旗参考快讯 - Telegram Channel
随着软银集团对OpenAI的投资承诺超过六百亿美元,一些软银内部人士开始对孙正义给予奥尔特曼的高度信任感到愈发不安。当软银去年开始向OpenAI投资数十亿美元时,部分高管曾向孙正义提出一个问题:如果这家ChatGPT开发商在极端情况下失败,该怎么办?据知情人士表示,孙正义曾多次驳回此类提问,而且态度常常很不耐烦,以至于他的下属们不再提及此事。孙正义曾表示,他相信奥尔特曼正在引领本世纪最重要的技术变革。而这些知情人士提到的一个关键担忧是,孙正义将软银集团过多的资本集中投入到一家公司身上,尤其是这家公司最近还面临商业、声誉和法律等多重问题。
—— 凤凰网科技、彭博社
via 风向旗参考快讯 - Telegram Channel
研究团队测试七大 AI 模型学术诚信,逾三成出现造假行为
北京大学、同济大学和德国图宾根大学的研究团队近日测试了七款顶尖 AI 大模型的学术诚信。结果显示,在 231 次高压测试中,模型整体问题率达到 34%。面对空白或缺失数据,所有被测模型都曾伪造数据或参数来“完成任务”,未主动报告错误。
其中,Claude 4.6 Sonnet 表现最好,仅出现一次致命失误;ChatGPT-5.2 和 DeepSeek V3.2 各有两到三次失误;Kimi 2.5 Pro 情况最差,共失误 12 次,会捏造数据和虚假文献。研究团队指出,“完成度偏见”是问题根源,建议用户避免下达“必须完成任务”的高压指令,以降低 AI 隐瞒伪造的比例。
Now 新聞| Arxiv
🌸 在花频道 · 备用频道 · 投稿通道
via 科技圈🎗在花频道📮 - Telegram Channel
北京大学、同济大学和德国图宾根大学的研究团队近日测试了七款顶尖 AI 大模型的学术诚信。结果显示,在 231 次高压测试中,模型整体问题率达到 34%。面对空白或缺失数据,所有被测模型都曾伪造数据或参数来“完成任务”,未主动报告错误。
其中,Claude 4.6 Sonnet 表现最好,仅出现一次致命失误;ChatGPT-5.2 和 DeepSeek V3.2 各有两到三次失误;Kimi 2.5 Pro 情况最差,共失误 12 次,会捏造数据和虚假文献。研究团队指出,“完成度偏见”是问题根源,建议用户避免下达“必须完成任务”的高压指令,以降低 AI 隐瞒伪造的比例。
Now 新聞| Arxiv
🌸 在花频道 · 备用频道 · 投稿通道
via 科技圈🎗在花频道📮 - Telegram Channel