https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持OpenAI, Claude, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持OpenAI, Claude, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
阿里通义千问 Qwen3 开源全新推理模型
阿里通义千问今日在公众号宣布推出全新推理模型 Qwen3-30B-A3B-Thinking-2507。相较于 4 月 29 日开源的 Qwen3-30-A3B 模型,新模型在推理能力、通用能力及上下文长度上有了显著提升:新模型在聚焦数学能力的 AIME25 评测中获85.0分,在代码能力测试LiveCodeBench v6中得分66.0,两项核心推理能力均超越 Gemini2.5-Flash(thinking)、Qwen3-235B-A22B (thinking);新模型的知识水平(GPQA、MMLU-Pro)也较上一版本进步显著;原生支持 256K tokens ,可扩展至 1M tokens 。新模型思考长度增加,团队建议在处理高度复杂的推理任务时,设置更长的思考预算,可以充分发挥新模型潜力。
—— 通义千问
via 风向旗参考快讯 - Telegram Channel
阿里通义千问今日在公众号宣布推出全新推理模型 Qwen3-30B-A3B-Thinking-2507。相较于 4 月 29 日开源的 Qwen3-30-A3B 模型,新模型在推理能力、通用能力及上下文长度上有了显著提升:新模型在聚焦数学能力的 AIME25 评测中获85.0分,在代码能力测试LiveCodeBench v6中得分66.0,两项核心推理能力均超越 Gemini2.5-Flash(thinking)、Qwen3-235B-A22B (thinking);新模型的知识水平(GPQA、MMLU-Pro)也较上一版本进步显著;原生支持 256K tokens ,可扩展至 1M tokens 。新模型思考长度增加,团队建议在处理高度复杂的推理任务时,设置更长的思考预算,可以充分发挥新模型潜力。
—— 通义千问
via 风向旗参考快讯 - Telegram Channel
🐱 无关文本“猫攻击”可使AI模型错误率翻倍,响应时间延长
一项发表在arXiv上的预印本研究显示,在数学题中加入与上下文无关的文本(研究人员称之为“CatAttack”)会系统性地误导AI模型,使其得出错误答案的概率增加一倍以上。研究人员使用DeepSeek V3、Qwen 3和Phi-4进行测试,结果显示“CatAttack”将错误答案的概率提高了最多700%。即使未导致错误,这种无关文本也会延长模型的响应时间,在16%的情况下将响应时间加倍,导致运行成本增加。
(科技情报)
via 茶馆 - Telegram Channel
一项发表在arXiv上的预印本研究显示,在数学题中加入与上下文无关的文本(研究人员称之为“CatAttack”)会系统性地误导AI模型,使其得出错误答案的概率增加一倍以上。研究人员使用DeepSeek V3、Qwen 3和Phi-4进行测试,结果显示“CatAttack”将错误答案的概率提高了最多700%。即使未导致错误,这种无关文本也会延长模型的响应时间,在16%的情况下将响应时间加倍,导致运行成本增加。
(科技情报)
via 茶馆 - Telegram Channel
猫会让 AI 困惑
2025-07-30 20:21 by 星空暗流
一道标准的数学题:△ABC,AB = 86,AC = 97,以 A 为圆心 AB 为半径的圆与 BC 相交于 B 和 X。BX 和 CX 的长度是整数。问 BC 的长度多少?趣问:猫大部分时间都在睡觉。人类解题者通常会略过最后一句话,但根据发表在 arXiv 上的一篇预印本,这句话会让 AI 模型得出错误答案的概率增加一倍以上。研究人员发现,在数学题中加入一段不相关的文本会系统性的误导模型输出错误答案。研究人员将这种针对 AI 的攻击策略称为 CatAttack。CatAttack 文本与上下文无关,人类解题者会忽略它,但 AI 模型不会。研究人员使用 DeepSeek V3、Qwen 3 和 Phi-4 进行了测试,结果显示 CatAttack 将错误答案的概率提高了最多 700%。即使 CatAttack 没有导致推理模型生成错误答案,它们的响应时间也延长了,16% 的情况下将响应时间加倍,速度显著下降导致成本增加。最后补充一句:猫是液体。
www.science.org/content/article/scienceadviser-cats-confuse-ai
#人工智能
via Solidot - Telegram Channel
2025-07-30 20:21 by 星空暗流
一道标准的数学题:△ABC,AB = 86,AC = 97,以 A 为圆心 AB 为半径的圆与 BC 相交于 B 和 X。BX 和 CX 的长度是整数。问 BC 的长度多少?趣问:猫大部分时间都在睡觉。人类解题者通常会略过最后一句话,但根据发表在 arXiv 上的一篇预印本,这句话会让 AI 模型得出错误答案的概率增加一倍以上。研究人员发现,在数学题中加入一段不相关的文本会系统性的误导模型输出错误答案。研究人员将这种针对 AI 的攻击策略称为 CatAttack。CatAttack 文本与上下文无关,人类解题者会忽略它,但 AI 模型不会。研究人员使用 DeepSeek V3、Qwen 3 和 Phi-4 进行了测试,结果显示 CatAttack 将错误答案的概率提高了最多 700%。即使 CatAttack 没有导致推理模型生成错误答案,它们的响应时间也延长了,16% 的情况下将响应时间加倍,速度显著下降导致成本增加。最后补充一句:猫是液体。
www.science.org/content/article/scienceadviser-cats-confuse-ai
#人工智能
via Solidot - Telegram Channel
7月31日,据科技网站TechCrunch报道,Meta CEO马克·扎克伯格(Mark Zuckerberg)周三在财报电话会议上强调了AI眼镜的重要性。他表示,眼镜将成为用户未来与AI交互的主要方式,没有AI眼镜的人将处于劣势。
扎克伯格
扎克伯格在财报电话会议上表示:“我依旧认为,眼镜基本上会成为AI的理想载体,因为你可以让AI看到你一天中所看到的一切,听到你所听到的一切,并与你进行交流。”
他补充道,给这些眼镜添加显示功能将释放更多价值,无论是像Meta下一代Orion AR眼镜那样提供更广阔的全息视野,还是像日常AI眼镜那样配备较小的显示屏。
“我认为,未来如果你没有具备AI功能的眼镜,或者没有某种与AI互动的方式,你可能会在认知能力明显落后于其他人。”
目前,Meta一直专注于打造智能眼镜产品,例如其推出的雷朋Meta眼镜,以及最近推出的Oakley Meta眼镜。这些眼镜可以让用户听音乐、拍照或录像,还能向Meta AI提问,包括识别用户所看到的内容等多种功能。眼镜巨头EssilorLuxottica表示,这类可穿戴设备意外地成为了市场热销品,雷朋Meta眼镜的销售收入同比增长超过两倍。
但是,扎克伯格认为,显示技术还有更大的发展空间。“这正是我们过去5到10年里在现实实验室倾注全力研究的领域,基本上涵盖了所有这些不同的技术。”他表示。
不过,未来的消费级AI设备未必一定是以眼镜的形式出现。今年春天,OpenAI以65亿美元收购了前苹果设计总监乔纳森·艾维(Jonathan Ive)创办的创业公司,旨在打造新的消费者设备来与AI互动。其他一些创业公司也在探索这一区域,包括AI别针(如Humane的失败尝试)和吊坠设备(如Limitless和Friend的产品)。
目前来看,眼镜似乎最为合理,因为很多人已经习惯佩戴眼镜,而且这种形式在社交场合更容易被接受。但过去人们也不知道自己需要智能手机,直到有人创造了它。下一个AI设备,可能是人们现在根本无法想象的东西。
尽管如此,扎克伯格依然坚信眼镜将成为主流。他说:“眼镜的另一个优势是,它们将成为融合现实与数字世界的理想载体。我认为整个元宇宙的愿景最终将变得极其重要,而AI将加速这一进程。”
via cnBeta.COM - 中文业界资讯站 (author: 稿源:凤凰网科技)
据 Chiphell 上的可靠消息称,AMD 似乎正在更新其 Ryzen 8000G 桌面 APU,将其升级为 Ryzen 9000G 系列。这些芯片将采用较旧的“Zen 4”微架构,而非最新的“Zen 5”。此前,预计 Ryzen 9000G 系列将基于 4 纳米“Strix Point”单片硅片或其升级版本“Krackan Point”。
该芯片采用双 CCX CPU 组件,其中一个 CCX 包含四个“Zen 5”核心,共享 16 MB 三级缓存;另一个 CCX 包含八个“Zen 5c”核心,共享 8 MB 三级缓存。“Zen 5c”核心的平均时钟速度低于“Zen 5”,因此不需要大量的末级缓存。
“Strix Point”还配备了一个拥有16个计算单元的大型RDNA 3.5 iGPU,最重要的是,它配备了一个强大的NPU,拥有50个AI TOPS,符合Microsoft Copilot+的要求。如果传言属实,Ryzen 9000G将不会配备这些功能。
如果基于较旧的4nm“Hawk Point”芯片,9000G系列将配备一个CCX CPU,八个全尺寸“Zen 4”核心共享一个16 MB L3缓存;以及一个基于RDNA 3的iGPU,拥有12个计算单元,但遗憾的是,它的NPU速度要慢得多,吞吐量仅为16 TOPS,不符合Copilot+的要求。
9000G系列与8000G系列的唯一区别或许在于速度上的细微提升,CPU主频全面提升约200 MHz,iGPU引擎主频提升100 MHz。一切还没有失去,因为非插槽移动 Ryzen AI 300“Strix Point”处理器可以在许多 MoD(桌面移动)迷你电脑中使用,我们可以从最近的产品发布中看到,PC OEM 都在使用 Ryzen AI Max“Strix Halo”芯片,并将其放入预装的台式机中。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
OpenAI的ChatGPT对话历史功能于2025年7月30日出现罕见故障,导致部分用户丢失了长达三个月的聊天记录和图片。OpenAI于美国东部时间中午确认了该问题,并于下午3:24部署了修复程序,但仍报告“性能下降”。用户反馈显示,问题影响了桌面端和移动端。尽管此次中断,OpenAI仍表示其23项服务整体正常运行时间为99.55%,其中对话历史功能正常运行时间为99.81%,表明此类故障并不常见。
(PCMag.com)
via 茶馆 - Telegram Channel