https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持OpenAI, Claude, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
阿里通义千问 Qwen3 开源全新推理模型

阿里通义千问今日在公众号宣布推出全新推理模型 Qwen3-30B-A3B-Thinking-2507。相较于 4 月 29 日开源的 Qwen3-30-A3B 模型,新模型在推理能力、通用能力及上下文长度上有了显著提升:新模型在聚焦数学能力的 AIME25 评测中获85.0分,在代码能力测试LiveCodeBench v6中得分66.0,两项核心推理能力均超越 Gemini2.5-Flash(thinking)、Qwen3-235B-A22B (thinking);新模型的知识水平(GPQA、MMLU-Pro)也较上一版本进步显著;原生支持 256K tokens ,可扩展至 1M tokens 。新模型思考长度增加,团队建议在处理高度复杂的推理任务时,设置更长的思考预算,可以充分发挥新模型潜力。

—— 通义千问

via 风向旗参考快讯 - Telegram Channel
🐱 无关文本“猫攻击”可使AI模型错误率翻倍,响应时间延长

一项发表在arXiv上的预印本研究显示,在数学题中加入与上下文无关的文本(研究人员称之为“CatAttack”)会系统性地误导AI模型,使其得出错误答案的概率增加一倍以上。研究人员使用DeepSeek V3、Qwen 3和Phi-4进行测试,结果显示“CatAttack”将错误答案的概率提高了最多700%。即使未导致错误,这种无关文本也会延长模型的响应时间,在16%的情况下将响应时间加倍,导致运行成本增加。

(科技情报)

via 茶馆 - Telegram Channel
猫会让 AI 困惑

2025-07-30 20:21 by 星空暗流

一道标准的数学题:△ABC,AB = 86,AC = 97,以 A 为圆心 AB 为半径的圆与 BC 相交于 B 和 X。BX 和 CX 的长度是整数。问 BC 的长度多少?趣问:猫大部分时间都在睡觉。人类解题者通常会略过最后一句话,但根据发表在 arXiv 上的一篇预印本,这句话会让 AI 模型得出错误答案的概率增加一倍以上。研究人员发现,在数学题中加入一段不相关的文本会系统性的误导模型输出错误答案。研究人员将这种针对 AI 的攻击策略称为 CatAttack。CatAttack 文本与上下文无关,人类解题者会忽略它,但 AI 模型不会。研究人员使用 DeepSeek V3、Qwen 3 和 Phi-4 进行了测试,结果显示 CatAttack 将错误答案的概率提高了最多 700%。即使 CatAttack 没有导致推理模型生成错误答案,它们的响应时间也延长了,16% 的情况下将响应时间加倍,速度显著下降导致成本增加。最后补充一句:猫是液体。

www.science.org/content/article/scienceadviser-cats-confuse-ai

#人工智能

via Solidot - Telegram Channel
AI眼镜多重要?扎克伯格:没有它,你连认知都会落后

7月31日,据科技网站TechCrunch报道,Meta CEO马克·扎克伯格(Mark Zuckerberg)周三在财报电话会议上强调了AI眼镜的重要性。他表示,眼镜将成为用户未来与AI交互的主要方式,没有AI眼镜的人将处于劣势。

扎克伯格

扎克伯格在财报电话会议上表示:“我依旧认为,眼镜基本上会成为AI的理想载体,因为你可以让AI看到你一天中所看到的一切,听到你所听到的一切,并与你进行交流。”

他补充道,给这些眼镜添加显示功能将释放更多价值,无论是像Meta下一代Orion AR眼镜那样提供更广阔的全息视野,还是像日常AI眼镜那样配备较小的显示屏。

“我认为,未来如果你没有具备AI功能的眼镜,或者没有某种与AI互动的方式,你可能会在认知能力明显落后于其他人。”

目前,Meta一直专注于打造智能眼镜产品,例如其推出的雷朋Meta眼镜,以及最近推出的Oakley Meta眼镜。这些眼镜可以让用户听音乐、拍照或录像,还能向Meta AI提问,包括识别用户所看到的内容等多种功能。眼镜巨头EssilorLuxottica表示,这类可穿戴设备意外地成为了市场热销品,雷朋Meta眼镜的销售收入同比增长超过两倍。

但是,扎克伯格认为,显示技术还有更大的发展空间。“这正是我们过去5到10年里在现实实验室倾注全力研究的领域,基本上涵盖了所有这些不同的技术。”他表示。

不过,未来的消费级AI设备未必一定是以眼镜的形式出现。今年春天,OpenAI以65亿美元收购了前苹果设计总监乔纳森·艾维(Jonathan Ive)创办的创业公司,旨在打造新的消费者设备来与AI互动。其他一些创业公司也在探索这一区域,包括AI别针(如Humane的失败尝试)和吊坠设备(如Limitless和Friend的产品)。

目前来看,眼镜似乎最为合理,因为很多人已经习惯佩戴眼镜,而且这种形式在社交场合更容易被接受。但过去人们也不知道自己需要智能手机,直到有人创造了它。下一个AI设备,可能是人们现在根本无法想象的东西。

尽管如此,扎克伯格依然坚信眼镜将成为主流。他说:“眼镜的另一个优势是,它们将成为融合现实与数字世界的理想载体。我认为整个元宇宙的愿景最终将变得极其重要,而AI将加速这一进程。”

via cnBeta.COM - 中文业界资讯站 (author: 稿源:凤凰网科技)
LangChain已死?不,是时候重新思考AI工程范式了

via 掘金人工智能本月最热 (author: 老周聊大模型)
通义Qwen3开源新推理模型 上下文可拓展至100万

7月31日,通义千问团队在公众平台发布消息,Qwen3-30B实现重大升级,全新推理模型Qwen3-30B-A3B-Thinking-2507正式发布。新模型拓展了思考能力,提升了推理的质量和深度,是一个更睿智、更敏捷、更全能的新推理模型。

新模型在推理能力、通用能力及上下文长度上有了显著提升,新模型在聚焦数学能力的AIME25评测中获85.0分,在代码能力测试LiveCodeBench v6中得分66.0,两项核心推理能力均超越Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking);新模型的知识水平(GPQA、MMLU-Pro)也较上一版本进步显著;在写作(WritingBench)、Agent能力(BFCL-v3)、多轮对话和多语言指令遵循(MultiIF)等通用能力评测中,Qwen3-30B-A3B-Thinking-2507均超越Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking);原生支持256K tokens,可扩展至1M tokens。

值得一提的是,新模型的思考长度增加,团队建议在处理高度复杂的推理任务时,设置更长的思考预算,可以充分发挥新模型潜力。

目前Qwen3-30B-A3B-Thinking-2507已在魔搭社区、HuggingFace上开源,Qwen Chat同步上线。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:凤凰网科技)
传AMD将把Ryzen 8000G台式机APU升级为9000G系列

据 Chiphell 上的可靠消息称,AMD 似乎正在更新其 Ryzen 8000G 桌面 APU,将其升级为 Ryzen 9000G 系列。这些芯片将采用较旧的“Zen 4”微架构,而非最新的“Zen 5”。此前,预计 Ryzen 9000G 系列将基于 4 纳米“Strix Point”单片硅片或其升级版本“Krackan Point”。

该芯片采用双 CCX CPU 组件,其中一个 CCX 包含四个“Zen 5”核心,共享 16 MB 三级缓存;另一个 CCX 包含八个“Zen 5c”核心,共享 8 MB 三级缓存。“Zen 5c”核心的平均时钟速度低于“Zen 5”,因此不需要大量的末级缓存。

“Strix Point”还配备了一个拥有16个计算单元的大型RDNA 3.5 iGPU,最重要的是,它配备了一个强大的NPU,拥有50个AI TOPS,符合Microsoft Copilot+的要求。如果传言属实,Ryzen 9000G将不会配备这些功能。

如果基于较旧的4nm“Hawk Point”芯片,9000G系列将配备一个CCX CPU,八个全尺寸“Zen 4”核心共享一个16 MB L3缓存;以及一个基于RDNA 3的iGPU,拥有12个计算单元,但遗憾的是,它的NPU速度要慢得多,吞吐量仅为16 TOPS,不符合Copilot+的要求。

9000G系列与8000G系列的唯一区别或许在于速度上的细微提升,CPU主频全面提升约200 MHz,iGPU引擎主频提升100 MHz。一切还没有失去,因为非插槽移动 Ryzen AI 300“Strix Point”处理器可以在许多 MoD(桌面移动)迷你电脑中使用,我们可以从最近的产品发布中看到,PC OEM 都在使用 Ryzen AI Max“Strix Halo”芯片,并将其放入预装的台式机中。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
Microsoft Copilot 测试“智能”模式 GPT-5可能在其中发挥作用

微软提供多种模式,让用户自定义 Copilot 的行为。与大多数依赖模型选择器的 AI 助手不同,微软选择了一种更精简的方法。这使得即使是非技术用户也可以轻松选择正确的模式,而无需了解正在使用的模型。

Copilot 已经提供了以下模式,每种模式都有不同的用途。

响应速度快(2-3秒内即可响应)
深入思考(可以在大约 30 秒内做出回应)
深入研究(大约10分钟内即可给出答复)

Copilot 中的“深度研究”与 ChatGPT 的“深度研究”功能相同。它允许用户高效地完成通常需要几个小时才能完成的复杂、多步骤的研究任务。

Copilot 中的Think Deeper功能采用 OpenAI 最新的推理模型(例如 o4-mini),帮助用户解决棘手的数学问题、管理复杂的家庭项目等等。此功能可以为棘手的问题提供详细的分步解答。

今天,一些用户开始注意到Copilot 中一种名为“智能”的全新未公布模式。据微软称此模式允许 Copilot 根据当前任务调整其思维速度,无论是更快还是更深入。虽然表面上看似简单,但这项功能却是一项与 OpenAI 备受期待的 GPT-5 模型紧密相关的独特功能。

OpenAI有望通过 GPT-5统一其 O 系列模型和 GPT 系列模型,从而创建能够决定是否进行长时间思考的系统。对于普通用户,ChatGPT 的免费套餐预计将提供对即将推出的标准智能级别的 GPT-5 模型的无限制访问。Plus 套餐用户可以选择在更高的智能设置下运行 GPT-5,而 Pro 套餐用户可以在更高级的智能级别下使用 GPT-5。

图片来源:X 上的 Bughunter Nerd

即将推出的“智能”模式的推出预示着未来 Gen AI 助手将更加直观,无需明确的模型或模式选择即可自动适应用户查询。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
扎克伯格发表公开信 希望Meta将其超级智能带给每个人

Meta 首席执行官马克·扎克伯格在一封题为“个人超级智能”的公开信中阐述了他对超级智能未来的愿景,并致力于让每个人都能享受到它。这家科技巨头最近开始在市场上招募最优秀的人工智能人才,以建立一个专门的超级智能实验室。

扎克伯格表示,他“极其乐观”地认为,Meta 的超级智能将“帮助人类加快进步的步伐”。他相信,这项技术可以“开启一个个人赋能的新时代,人们将拥有更大的自主权,按照自己选择的方向改善世界”。

Meta 首席执行官补充道,他的愿景是让每个人都拥有个人超级智能。他认为,最终目标是打造一个能够深入了解我们、理解我们的目标并帮助我们实现目标的人工智能——这将是迄今为止最有用的技术形式:
这与业内其他人的观点截然不同,他们认为超级智能应该集中用于实现所有有价值的工作的自动化,然后人类将依靠其产出过活。在 Meta,我们相信,人们追求个人理想是我们不断进步的动力,推动着繁荣、科学、健康和文化的发展。这一点在未来也将变得越来越重要。
扎克伯格强调,智能眼镜能够看、听,并与我们互动,是一种情境感知设备,有望成为我们主要的计算平台。这一愿景与Meta 最近在制造人工智能智能眼镜方面的进展相契合。

过去几个月,Meta 因从 OpenAI 和苹果等竞争对手挖走 AI 研究人员而频频登上新闻头条。据报道,Meta 为这些研究人员提供了高达 1 亿美元的签约奖金,其中大多数来自中国,近 40% 是前 OpenAI 员工。

Meta 积极布局,致力于建立自己的超级智能实验室。因此,它需要吸引全球顶尖人才,才能将这一愿景变为现实。超级智能是人工智能领域的一个新概念,旨在构建一个超越人类认知能力、提供人类无法企及的智能性能的人工智能模型。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
outages Takes Down Major ChatGPT Feature

OpenAI的ChatGPT对话历史功能于2025年7月30日出现罕见故障,导致部分用户丢失了长达三个月的聊天记录和图片。OpenAI于美国东部时间中午确认了该问题,并于下午3:24部署了修复程序,但仍报告“性能下降”。用户反馈显示,问题影响了桌面端和移动端。尽管此次中断,OpenAI仍表示其23项服务整体正常运行时间为99.55%,其中对话历史功能正常运行时间为99.81%,表明此类故障并不常见。

(PCMag.com)

via 茶馆 - Telegram Channel
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]