https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
DeepSeek 发表 R1 模型论文,称训练成本仅 29.4 万美元
2025-09-18 22:54 by 星际归途
DeepSeek 的研究人员在《自然》期刊上发表了 R1 模型论文《DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement learning》。研究人员披露 R1 的训练成本仅 29.4 万美元,但其基础模型花了约 600 万美元;R1 主要使用英伟达的 H800 AI 芯片训练,该芯片自 2023 年起被禁止出口到中国。DeepSeek 的主要创新是使用名叫纯强化学习(pure reinforcement learning)的方法自动化试错,对模型得出正确答案进行奖励,而不是教它遵循人类选择的推理示例。模型还使用名叫 group relative policy optimization 的方法给自己打分。对于今年早些使用 OpenAI 指责 DeepSeek 使用其模型的输出进行训练,研究人员予以否认。DeepSeek-R1 是 Hugging Face 上最受欢迎的模型之一,下载量达到 1090 万次,2025 年使用强化学习的大模型几乎都受到了 R1 的启发。
www.nature.com/articles/s41586-025-09422-z
www.nature.com/articles/d41586-025-03015-6
#人工智能
via Solidot - Telegram Channel
2025-09-18 22:54 by 星际归途
DeepSeek 的研究人员在《自然》期刊上发表了 R1 模型论文《DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement learning》。研究人员披露 R1 的训练成本仅 29.4 万美元,但其基础模型花了约 600 万美元;R1 主要使用英伟达的 H800 AI 芯片训练,该芯片自 2023 年起被禁止出口到中国。DeepSeek 的主要创新是使用名叫纯强化学习(pure reinforcement learning)的方法自动化试错,对模型得出正确答案进行奖励,而不是教它遵循人类选择的推理示例。模型还使用名叫 group relative policy optimization 的方法给自己打分。对于今年早些使用 OpenAI 指责 DeepSeek 使用其模型的输出进行训练,研究人员予以否认。DeepSeek-R1 是 Hugging Face 上最受欢迎的模型之一,下载量达到 1090 万次,2025 年使用强化学习的大模型几乎都受到了 R1 的启发。
www.nature.com/articles/s41586-025-09422-z
www.nature.com/articles/d41586-025-03015-6
#人工智能
via Solidot - Telegram Channel
🖥️ Windows 11截图工具新增“快速标记”功能,提升编辑效率
微软已向Windows 11的Canary和Dev频道内测用户推送截图工具版本11.2508.24.0,新增“快速标记”功能。用户可通过Win + Shift + S快捷键或直接启动应用,在捕获工具栏中启用此功能。它允许用户在确定截图前直接进行标注,提供画笔、荧光笔、橡皮擦、形状和表情符号等基础工具,并支持重新裁剪、快速分享、必应视觉搜索及调用Copilot助手。需要注意的是,使用快速标记编辑的截图不会自动保存到剪贴板。此更新旨在减少频繁截图和编辑的操作步骤,提高用户效率。
(科技圈)
via 茶馆 - Telegram Channel
微软已向Windows 11的Canary和Dev频道内测用户推送截图工具版本11.2508.24.0,新增“快速标记”功能。用户可通过Win + Shift + S快捷键或直接启动应用,在捕获工具栏中启用此功能。它允许用户在确定截图前直接进行标注,提供画笔、荧光笔、橡皮擦、形状和表情符号等基础工具,并支持重新裁剪、快速分享、必应视觉搜索及调用Copilot助手。需要注意的是,使用快速标记编辑的截图不会自动保存到剪贴板。此更新旨在减少频繁截图和编辑的操作步骤,提高用户效率。
(科技圈)
via 茶馆 - Telegram Channel
据知情人士透露,软银集团计划与OpenAI成立一家合资企业,为日本的企业客户提供人工智能服务,但目前这一计划的进展已明显落后于预期。
消息人士称,该合资企业原定于今年夏天成立,但筹备工作的时间比预期要长,预计11月将公布最新进展。该消息人士拒绝透露姓名,因细节尚未公开。
软银表示,准备工作正在进行中,但拒绝就细节置评。OpenAI没有立即回应置评请求。
软银首席执行官孙正义与OpenAI首席执行官萨姆·奥特曼今年2月宣布成立SB OpenAI日本公司。软银表示,该合资企业将由OpenAI和软银及其国内电信部门成立的一家公司所有。
在6月份的股东大会上,软银电信子公司首席执行官Junichi Miyakawa曾表示,目标是在7月底成立该合资公司。他当时说,该公司将提供的产品正在讨论中。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
9 月 16 日,JetBrains 针对近期用户对新 AI 配额政策的不满,发布了一份 FAQ 说明。公司承认在早期阶段因缺乏使用数据,临时设置了远高于实际成本的额度,如今调整后造成“体验变差”的落差感,“这是我们设定预期有误”。
JetBrains 表示,新的额度是基于真实的公有模型 token 成本来设定的,并将逐步上线详细用量统计和提醒机制,帮助用户更好地控制支出。官方同时强调,AI Ultimate 年付方案的价值约比市场价高出 40%,并为已购年付用户准备了特殊补偿选项。
对于用户最关心的“额度缩减过快”,JetBrains 解释称,复杂的代理式工作流(如其代码代理 Junie)会消耗更多 token,这是高质量输出的代价。公司承诺将继续优化性能,同时提供使用指引,让用户在不同任务中合理选择模型与交互方式。
JetBrains 表示,AI 不可能是“免费无限魔法”,价格与价值必须匹配。公司将坚持可持续发展模式,“一步步交付真正有价值的功能”。
据悉,这是自cursor Gtihub Copilot缩减配额以后又一家代码开发相关公司的配额削减
来源:JetBrains AI 官方博客
The JetBrains Blog
FAQ: New AI Quotas | The JetBrains Blog
Starting August 25, 2025, we’re rolling out a new AI quota model that makes AI subscriptions easier to understand and manage, while also letting you seamlessly extend your usage beyond your included quota .
via LoopDNS资讯播报 - Telegram Channel
梁文锋DeepSeek论文登上《自然》封面
本周三,梁文锋团队在《自然》杂志发表论文,介绍开源AI模型DeepSeek-R1采用的大规模推理模型训练方法。研究表明,通过纯强化学习训练大规模推理模型,可有效提升大语言模型推理能力并降低人类输入需求。这款模型在数学、编程竞赛及STEM领域研究生水平任务中表现优异,如数学基准测试得分达 77.9% (DeepSeek-R1-Zero) 和79.8% ( DeepSeek-R1) 。模型以解决问题获奖励机制强化学习,减少训练成本与复杂性。梁文锋团队总结说,未来研究可以聚焦优化奖励过程,以确保推理和任务结果更可靠。
—— 科技日报
via 风向旗参考快讯 - Telegram Channel
本周三,梁文锋团队在《自然》杂志发表论文,介绍开源AI模型DeepSeek-R1采用的大规模推理模型训练方法。研究表明,通过纯强化学习训练大规模推理模型,可有效提升大语言模型推理能力并降低人类输入需求。这款模型在数学、编程竞赛及STEM领域研究生水平任务中表现优异,如数学基准测试得分达 77.9% (DeepSeek-R1-Zero) 和79.8% ( DeepSeek-R1) 。模型以解决问题获奖励机制强化学习,减少训练成本与复杂性。梁文锋团队总结说,未来研究可以聚焦优化奖励过程,以确保推理和任务结果更可靠。
—— 科技日报
via 风向旗参考快讯 - Telegram Channel
到目前为止 Windows 11 记事本应用提供的 AI 功能均需要调用云端模型,也就是使用 Microsoft Copilot AI 进行操作,当然这还存在使用限制而不是可以无限次调用 AI 模型。现在微软在记事本中带来本地 AI 功能的支持,如果用户使用的设备具有本地 AI 功能,那么不需要再登录微软账号和使用 Microsoft Copilot AI 生成内容。
具体来说如果用户使用的设备附带 NPU 芯片或 NPU 单元那可以使用微软提供的本地 AI 模型,记事本等应用可以调用设备端的本地 AI 模型进行内容处理,数据不需要发送到云端。
记事本中提供的本地 AI 模型操作包括生成文本、重写现有文本或者总结文本等,当然这些任务对 AI 算力的要求比较低,所以设备端 AI 模型处理器应该也很快。
对部分用户来说微软给记事本添加如此多的新功能是个值得开心的事情,不过也有不少用户并不喜欢微软的做法,因为纯粹的记事本变得越来越复杂。
现在的记事本不仅支持文本内容,还支持 Markdown 格式,支持拼写检查、制表符等等,所以记事本已经可以与某些功能丰富的编辑器相媲美,而追求简洁的用户认为这并不好。
注:带有设备端 AI 模型支持的记事本目前正在 Windows Insider 预览计划中进行测试,使用正式版的用户还需要等待后续推送。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:蓝点网)
特斯拉与SpaceX首席执行官埃隆·马斯克在社交平台X上表示,其旗下人工智能公司xAI正在研发的Grok 5模型有望实现通用人工智能(AGI)的重大突破。这一看法显著区别于他以往的态度。马斯克坦言,此前自己从未将Grok系列与AGI直接联系起来。
据他透露,Grok 5模型的训练预计将在未来几周内启动。作为xAI的旗舰产品,Grok系列一直以其实时信息处理能力受到关注,而此次更新版本更被寄予厚望。
行业分析认为,若Grok 5能够实现AGI,将代表人工智能实现从专用领域向通用认知能力的质的飞跃。
尽管目前Grok 5的具体技术细节尚未公开,但马斯克强调该模型将采用全新的架构设计。与现有AI系统相比,AGI具有理解、学习并跨领域应用知识的能力,被广泛视为人工智能发展的终极目标。科技界正在密切关注xAI能否在竞争日益激烈的大模型赛道中实现突破。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)