https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
OpenAI 将办 GPT-5.5 发布派对:AI 自主策划,奥尔特曼邀马斯克出席
OpenAI 首席执行官萨姆·奥尔特曼近日透露,公司将完全按照最新旗舰模型 GPT-5.5 的“自主提议”,为其举办一场专属的发布庆祝活动。
GPT-5.5 不仅将派对日期定于 5 月 5 日,还对活动流程提出了具体要求:人类演讲环节需尽量简短,应由“人类创造者”来举杯祝酒,并在现场特设专区,以收集用户对下一代模型的开发建议。奥尔特曼坦言,AI 展现出的这种涌现行为令人惊叹,公司决定全盘采纳其建议。
颇具戏剧性的是,对于这场由 AI 亲自策划的派对,奥尔特曼还公开向正与自己对簿公堂的马斯克发出了邀请。他大方表示:“如果他想来,随时欢迎,世界需要更多的爱。”
Business Insider
🌸 在花频道 · 茶馆讨论 · 投稿通道
via 科技圈🎗在花频道📮 - Telegram Channel
OpenAI 首席执行官萨姆·奥尔特曼近日透露,公司将完全按照最新旗舰模型 GPT-5.5 的“自主提议”,为其举办一场专属的发布庆祝活动。
GPT-5.5 不仅将派对日期定于 5 月 5 日,还对活动流程提出了具体要求:人类演讲环节需尽量简短,应由“人类创造者”来举杯祝酒,并在现场特设专区,以收集用户对下一代模型的开发建议。奥尔特曼坦言,AI 展现出的这种涌现行为令人惊叹,公司决定全盘采纳其建议。
颇具戏剧性的是,对于这场由 AI 亲自策划的派对,奥尔特曼还公开向正与自己对簿公堂的马斯克发出了邀请。他大方表示:“如果他想来,随时欢迎,世界需要更多的爱。”
Business Insider
🌸 在花频道 · 茶馆讨论 · 投稿通道
via 科技圈🎗在花频道📮 - Telegram Channel
Apple CarPlay近期在功能拓展上迈出重要一步,开始支持AI聊天机器人。在这一轮更新中,第三个即将加入的应用备受关注——它就是Grok。在最新版的iPhone版Grok应用中,已悄然出现了一个Apple CarPlay占位应用。
尽管目前该功能尚无法正常使用,但这一占位图标的出现,无疑是一个强烈信号,xAI公司正在积极筹备,计划在不久的将来为Apple车载系统提供支持。
用户尝试启动该应用时,屏幕上会显示一条提示信息:“Grok语音模式即将登陆CarPlay。”
值得一提的是,Grok此前已是特斯拉汽车的内置功能。此次即将推出的CarPlay支持,意味着这款AI聊天机器人将突破特斯拉的局限,进入几乎所有其他品牌的车载系统,为更广泛的用户群体带来便捷的交互体验。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)
测试表明 DeepSeek V4 的性能比美国领先模型落后约 8 个月
DeepSeek V4 是迄今为止在 CAISI 评估的各个领域(网络安全、软件工程、自然科学、抽象推理和数学)中性能最强的 PRC 模型。CAISI 在上述五个领域中的九个基准测试中对模型进行了评估,其中包括两个未受污染的独立基准测试:ARC-AGI-2 的半私有数据集和 CAISI 内部开发的软件工程评估平台 PortBench。DeepSeek V4 的性能比美国领先模型落后约 8 个月
—— 美国国家标准及技术研究所
via 风向旗参考快讯 - Telegram Channel
DeepSeek V4 是迄今为止在 CAISI 评估的各个领域(网络安全、软件工程、自然科学、抽象推理和数学)中性能最强的 PRC 模型。CAISI 在上述五个领域中的九个基准测试中对模型进行了评估,其中包括两个未受污染的独立基准测试:ARC-AGI-2 的半私有数据集和 CAISI 内部开发的软件工程评估平台 PortBench。DeepSeek V4 的性能比美国领先模型落后约 8 个月
DeepSeek V4 是迄今为止经 CAISI 评估的最强大的中国人工智能模型。CAISI的评估涵盖网络安全、软件工程、自然科学、抽象推理和数学等领域。
DeepSeek V4 在 DeepSeek 自行发布的评估中得分高于 CAISI 的评估结果。根据 DeepSeek 的数据,DeepSeek V4 的性能与大约两个月前发布的 Opus 4.6 和 GPT-5.4 相当。然而,CAISI 的评估(包括非公开基准测试)表明,DeepSeek V4 的性能与大约八个月前发布的 GPT-5 类似。
与其他功能相近的型号相比,DeepSeek V4 更具成本效益。与最具性价比的美国参考型号(GPT-5.4 mini)相比,DeepSeek V4 在 7 项基准测试中的 5 项上都更具成本效益。在这 7 项基准测试中,DeepSeek V4 的价格优势在 53% 到 41% 之间。
—— 美国国家标准及技术研究所
via 风向旗参考快讯 - Telegram Channel
受超预期财报提振,谷歌母公司Alphabet股价周四(4月30日)大涨10%,年内累计涨幅达到140%,市值突破4.6万亿美元。该公司周三公布的营收超出分析师预期,其中谷歌云业务收入更是突破200亿美元大关。
目前,全球市值第一的公司仍是人工智能芯片霸主英伟达,市值接近4.9万亿美元。不过,由于商业伙伴OpenAI被曝未能达成内部收入与增长预期,英伟达股价在两天内累计下跌超过6%。
若英伟达在5月20日发布的财报中未能实现反弹,期權市场预测,Alphabet最早可能在5月15日登顶全球市值第一。要实现这一目标,Alphabet的市值需要追上英伟达当前水平,股价需再上涨约4%,达到约401美元。
期权交易员认为,从现在到5月15日之间,Alphabet股价触及401美元的概率约为53%。
另据ThinkOrSwim数据显示,Alphabet股价在5月22日(即英伟达财报发布后的星期五)收于400美元以上的概率约为30%。
值得一提的是,Alphabet上一次成为全球市值最高的公司是在2016年,当时它曾短暂超越苹果,登上榜首。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)
VS Code 默认将 Copilot 作为共同作者,即使用户只使用行内补全功能。
在 VS Code 1.110 中,微软引入 git.addAICoAuthor 设置,最初默认值为 off;随后在 1.118 中将默认值改为 all,意味着任意可识别的 Copilot AI 生成代码,包括行内补全、Chat、Agent 编辑,都可能在 Git 提交中加入 Co-authored-by: Copilot。在受到社区争议后,微软又将默认值改为 chatAndAgent,即仅针对 Chat 和 Agent 工作流自动署名,不再覆盖普通行内补全。相关修正预计将在未来的 VS Code 1.119 中发布。
VS Code 更新日志 | Github
🌸 在花频道 · 茶馆讨论 · 投稿通道
via 科技圈🎗在花频道📮 - Telegram Channel
在 VS Code 1.110 中,微软引入 git.addAICoAuthor 设置,最初默认值为 off;随后在 1.118 中将默认值改为 all,意味着任意可识别的 Copilot AI 生成代码,包括行内补全、Chat、Agent 编辑,都可能在 Git 提交中加入 Co-authored-by: Copilot。在受到社区争议后,微软又将默认值改为 chatAndAgent,即仅针对 Chat 和 Agent 工作流自动署名,不再覆盖普通行内补全。相关修正预计将在未来的 VS Code 1.119 中发布。
VS Code 更新日志 | Github
🌸 在花频道 · 茶馆讨论 · 投稿通道
via 科技圈🎗在花频道📮 - Telegram Channel
科技圈🎗在花频道📮:
🤖 DeepSeek-V4 的预览版本正式上线并同步开源,极其便宜大碗且适配 Agent 相比前代模型,DeepSeek-V4-Pro 的 Agent 能力显著增强。在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro 超越当前所有已公开评测的开源模型,追及「御三家」模型能力。 DeepSeek-V4-Flash 展现出了接近高级模型的的推理能力与 Agent 能力(适合日常龙虾等服务)。而由于模型参数和激活更小,相较之下 V4-Flash 能够提供更加快捷、经济的 API 服务。 DeepSeek…
美国 CAISI 发布 DeepSeek V4 Pro 评估报告,称 DeepSeek V4 Pro 能力落后美国前沿约 8 个月
美国国家标准与技术研究院(NIST)下属人工智能标准与创新中心(CAISI)评估显示,中国开源模型 DeepSeek V4 Pro 在综合能力上比美国最先进模型落后约 8 个月。在 CAISI 选取的基准中,其 Elo 得分 800,低于 GPT-5.5(999)和 Opus 4.6(800),与 GPT-5.4 mini(749)相近。尤其在 ARC-AGI-2、PortBench 和 CTF-Archive-Diamond 等代理与推理测试上表现较弱。但成本方面,与相近能力的 GPT-5.4 mini 相比,DeepSeek V4 Pro 在 7 个基准中的 5 个上成本更低。
NIST
🌸 在花频道 · 茶馆讨论 · 投稿通道
via 科技圈🎗在花频道📮 - Telegram Channel
英国 NHS 以 AI 为由准备关闭所有开源库
2026-05-03 00:07 by 独眼巨人的笑声
日程安排平台 Cal.com 上月宣布从开源转为闭源,理由是 AI 工具更容易从开源代码中发现漏洞,而安全性依赖于模糊,因此闭源有助于提高安全。现在英国国家医疗服务体系(NHS)以相同的理由准备关闭它几乎所有的开源库,这一决定引发了广泛争议和批评。批评者指出 NHS 公布的大部分开源库是数据集、内部工具、指南、研究工具、前端设计等,它们不会因为安全扫描技术的进步而受到影响。此外是否开源对于 Anthropic Mythos 之类的 AI 工具并无区别,因为它们也能分析二进制程序并寻找漏洞。批评者发表了公开信,呼吁 NHS 保持其代码公开。
https://lwn.net/Articles/1070864/
https://keepthingsopen.com/
#开源
via Solidot - Telegram Channel
2026-05-03 00:07 by 独眼巨人的笑声
日程安排平台 Cal.com 上月宣布从开源转为闭源,理由是 AI 工具更容易从开源代码中发现漏洞,而安全性依赖于模糊,因此闭源有助于提高安全。现在英国国家医疗服务体系(NHS)以相同的理由准备关闭它几乎所有的开源库,这一决定引发了广泛争议和批评。批评者指出 NHS 公布的大部分开源库是数据集、内部工具、指南、研究工具、前端设计等,它们不会因为安全扫描技术的进步而受到影响。此外是否开源对于 Anthropic Mythos 之类的 AI 工具并无区别,因为它们也能分析二进制程序并寻找漏洞。批评者发表了公开信,呼吁 NHS 保持其代码公开。
https://lwn.net/Articles/1070864/
https://keepthingsopen.com/
#开源
via Solidot - Telegram Channel
为什么 OpenAI 的系统提示词要专门限制 Goblins
2026-05-02 00:27 by 奇迹男孩与冰霜巨人
OpenAI Codex CLI 系统提示词专门加入了一条对地精(Goblins)等词的限制:“never talk about goblins, gremlins, raccoons, trolls, ogres, pigeons, or other animals or creatures unless it is absolutely and unambiguously relevant to the user's query”。官方解释称,从 GPT-5.1 开始该公司的模型在比喻中提及 goblin 等词的频率大增,ChatGPT 中 goblin 的使用量增加了 175%,gremlin 使用量增加了 52%。它为此展开了调查,发现是因为 Nerdy 个性无意中奖励了此类比喻,导致高频使用 goblin 的行为扩散。为解决该问题,OpenAI 淘汰了 Nerdy 个性,移除了对 goblin 友好的奖励信号,从训练数据过滤掉相关示例,防止其再次不恰当的出现。
https://github.com/openai/codex/commit/c10f95ddac7b35095d334dece2ebcf69bcde61fc
https://openai.com/index/where-the-goblins-came-from/
#人工智能
via Solidot - Telegram Channel
2026-05-02 00:27 by 奇迹男孩与冰霜巨人
OpenAI Codex CLI 系统提示词专门加入了一条对地精(Goblins)等词的限制:“never talk about goblins, gremlins, raccoons, trolls, ogres, pigeons, or other animals or creatures unless it is absolutely and unambiguously relevant to the user's query”。官方解释称,从 GPT-5.1 开始该公司的模型在比喻中提及 goblin 等词的频率大增,ChatGPT 中 goblin 的使用量增加了 175%,gremlin 使用量增加了 52%。它为此展开了调查,发现是因为 Nerdy 个性无意中奖励了此类比喻,导致高频使用 goblin 的行为扩散。为解决该问题,OpenAI 淘汰了 Nerdy 个性,移除了对 goblin 友好的奖励信号,从训练数据过滤掉相关示例,防止其再次不恰当的出现。
https://github.com/openai/codex/commit/c10f95ddac7b35095d334dece2ebcf69bcde61fc
https://openai.com/index/where-the-goblins-came-from/
#人工智能
via Solidot - Telegram Channel
OpenClaw 支持用 ChatGPT 账户登录并使用订阅
Sam Altman 在 X 上发帖称,OpenClaw 已支持用户使用 ChatGPT 账户登录,并可使用原有的 ChatGPT 订阅。
Sam Altman(@sama)
🌸 在花频道 · 茶馆讨论 · 投稿通道
via 科技圈🎗在花频道📮 - Telegram Channel
Sam Altman 在 X 上发帖称,OpenClaw 已支持用户使用 ChatGPT 账户登录,并可使用原有的 ChatGPT 订阅。
Sam Altman(@sama)
🌸 在花频道 · 茶馆讨论 · 投稿通道
via 科技圈🎗在花频道📮 - Telegram Channel
腾讯近日正式开源紧凑型 AI 翻译模型 Hy-MT1.5-1.8B-1.25bit。该公司声称,该模型在保持高性能的同时,可在智能手机上实现完全离线运行。目前,该模型支持包括中、英、德、法、日、藏、蒙在内的33种语言及5种方言,涵盖1056个翻译方向,并在国际机器翻译大赛中累计斩获30项冠军。
技术突破的核心在于“激进压缩”方案:通过每参数仅使用1.25比特的量化技术,该模型体积从3.3GB 骤减至440MB,较此前的1.67比特方案缩小约25%,推理速度提升约10%,且未产生质量损失。在标准基准测试中,仅440MB 的 Hy-MT 表现出与商业翻译服务及 Qwen3-32B 等超大模型相当的翻译质量,实现了以极小量级抗衡百 GB 级模型的跨越。
目前,腾讯已提供 Android 演示应用(APK 形式),支持对手机内任何应用的文字进行跨屏离线翻译。行业观察指出,随着谷歌推出本地化模型 Gemma4,终端侧 AI(On-device AI)已成为技术竞争新前线。腾讯 Hy-MT 通过量化技术的突破,大幅降低了高品质 AI 翻译的算力门槛,为智能终端在复杂隐私环境下的离线应用提供了极具竞争力的开源底座。
via AI新闻资讯 (author: AI Base)