https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持OpenAI, Claude, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持OpenAI, Claude, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
谷歌 Gemini 获得了升级的图像创作工具
谷歌在周三的博客文章中宣布,Gemini聊天机器人应用现在允许用户修改AI生成的图像以及从手机或电脑上传的图像。Gemini的本地图像编辑功能将从今天开始逐步推出,该服务将在未来几周扩展到大多数国家,并支持超过45种语言。与ChatGPT最近升级的图像编辑工具类似,Gemini新推出的本地编辑器理论上能比独立AI图像生成器获得更好的效果。Gemini 现提供“多步骤”编辑流程,能根据用户的文本和图像提示,生成更丰富和更具上下文的响应。用户可以在Gemini中更换图像背景、替换物品、添加元素等。
—— Techcrunch
via 风向旗参考快讯 - Telegram Channel
谷歌在周三的博客文章中宣布,Gemini聊天机器人应用现在允许用户修改AI生成的图像以及从手机或电脑上传的图像。Gemini的本地图像编辑功能将从今天开始逐步推出,该服务将在未来几周扩展到大多数国家,并支持超过45种语言。与ChatGPT最近升级的图像编辑工具类似,Gemini新推出的本地编辑器理论上能比独立AI图像生成器获得更好的效果。Gemini 现提供“多步骤”编辑流程,能根据用户的文本和图像提示,生成更丰富和更具上下文的响应。用户可以在Gemini中更换图像背景、替换物品、添加元素等。
—— Techcrunch
via 风向旗参考快讯 - Telegram Channel
#AI·产品 #AI新时代
站点名称: QWQ AI
描述: 由 QWQ-32B 提供支持的高级 AI 助手,通过详细的推理为您的问题提供周到的解答
链接: https://qwq32.com/
前往导航: www.noisedh.cn 或 www.noisedh.link
Qwq32
QWQ AI - Intelligent Q&A Assistant
An advanced AI assistant powered by QWQ-32B that provides thoughtful answers to your questions with detailed reasoning
via 🎉 Efficiency资源干货全收录 - Telegram Channel
据报道,OpenAI此前宣布,自2025年4月30日起,GPT-4将从CHATGPT中退役,由GPT-4o完全替代 ,不过GPT-4仍将在API中提供。OpenAI表示,在面对面的评估中,GPT-4o在写作、编码、STEM等方面持续超越GPT-4。最近的升级进一步改进了GPT-4o的指令跟踪、问题解决和对话流程,使其成为GPT-4的自然继承者。据悉,GPT-4于2023年3月发布,较上一代GPT-3.5有了显著提升。而GPT-4o是OpenAI为聊天机器人ChatGPT发布的一款多模态大模型,于2024年5月14日发布,其中 “o” 代表 “omni”,意为 “全能”。该模型可以使ChatGPT能够处理50种不同的语言,并接受文本、音频和图像三者组合作为输入,生成文本、音频和图像的任意组合输出。 ...
PC版:https://www.cnbeta.com.tw/articles/soft/1496714.htm
手机版:https://m.cnbeta.com.tw/view/1496714.htm
cnBeta.COM
OpenAI CEO奥特曼发文:永别了 GPT-4
当地时间5月1日上午10:23,OpenAI创始人奥特曼发文向GPT-4告别:“再见了,GPT-4。你掀起了一场革命。我们将自豪地将你的重量保存在一个特殊的硬盘中,以便将来送给一些历史学家。”
via cnBeta.COM中文业界资讯站 - Telegram Channel
奥尔特曼投资公司在全美推出眼球扫描技术
由 OpenAI CEO 萨姆·奥尔特曼共同创立的初创公司 Tools for Humanity 计划在美国各地正式推出数千台眼球扫描设备“Orb”,这标志着该公司及其新颖的身份识别服务将迎来重大扩张。该公司在周三晚些时候的一场活动中表示,从本周开始,包括旧金山、洛杉矶和亚特兰大在内的六座美国城市的居民将能够在Tools for Humanity公司的World项目运营的特定地点以及某些合作伙伴处,使用球形的 Orb 设备扫描他们的眼球。同意扫描的人还可以通过该公司获得名为 Worldcoin 的加密货币代币。该公司还宣布,其将与约会应用公司 Match集团合作,开展年龄验证试点项目,首先从日本的Tinder用户开始。
—— 彭博社
via 风向旗参考快讯 - Telegram Channel
由 OpenAI CEO 萨姆·奥尔特曼共同创立的初创公司 Tools for Humanity 计划在美国各地正式推出数千台眼球扫描设备“Orb”,这标志着该公司及其新颖的身份识别服务将迎来重大扩张。该公司在周三晚些时候的一场活动中表示,从本周开始,包括旧金山、洛杉矶和亚特兰大在内的六座美国城市的居民将能够在Tools for Humanity公司的World项目运营的特定地点以及某些合作伙伴处,使用球形的 Orb 设备扫描他们的眼球。同意扫描的人还可以通过该公司获得名为 Worldcoin 的加密货币代币。该公司还宣布,其将与约会应用公司 Match集团合作,开展年龄验证试点项目,首先从日本的Tinder用户开始。
—— 彭博社
via 风向旗参考快讯 - Telegram Channel
不仅如此,还能够改变图像的风格。在下面的例子中,你可以看到狗狗被加了一顶帽子,然后草地背景变成了海滩。另一个例子是“你可以上传一张个人照片,然后 Gemini 会生成一张你用不同发色会是什么样子的图片”。底层功能上线后(会有内联提示),可以使用任何当前模型开始图像编辑。Google所谓的“直观、多步骤编辑”的另一个好处是“通过整合文本和图像,对你的提示做出更丰富、更具情境性的回应”。其中一个例子就是要求提供包含图像的分步说明。例如,您可以要求 Gemini 创建有关龙的睡前故事的初稿,并提供与故事相符的图片。在安全方面,“使用原生图像生成功能创建或编辑的图像将包含不可见的 SynthID 数字水印”。Google还“正在尝试在所有由 Gemini 生成的图像上添加可见的水印”。在上面的例子中,它是右下角药丸形容器中的“ai”。上个月,Google在 AI Studio 中大力宣传 Flash 2.0 如何出色地渲染带有文本的图像(无论文本长度如何),以及如何“利用世界知识和增强推理能力来创建正确的图像”。从今天开始,原生图像编辑功能将逐步在 Gemini 应用中推出。该功能将“在未来几周内扩展到更多用户,支持超过 45 种语言,覆盖大多数国家/地区”。 ...
PC版:https://www.cnbeta.com.tw/articles/soft/1496684.htm
手机版:https://m.cnbeta.com.tw/view/1496684.htm
cnBeta.COM
Google在Gemini应用中推出原生AI图像编辑功能
经过上个月的开发人员测试后,Google开始在Gemini应用程序中推出原生AI图像编辑功能。您可以使用自然语言文本提示编辑手动上传的图片以及Gemini应用生成的图片,并不断请求Google进行编辑,直到满意为止,并且上下文始终保留,这包括更改背景、替换对象和添加元素。
via cnBeta.COM中文业界资讯站 - Telegram Channel
今天,亚马逊宣布推出 Nova Premier 模型,这是其功能最强大的模型,适用于执行复杂任务,并可作为模型蒸馏的“老师”。亚马逊声称,Nova Premier 可用于 Amazon Bedrock 模型蒸馏,从而为特定垂直行业和特定场景创建经济高效、低延迟的 Amazon Nova Pro、Lite 和 Micro 版本。Nova Premier 支持 100 万个 token 上下文窗口和 200 多种语言。就性能而言,Nova Premier 并非最先进的 (SOTA) 模型。亚马逊在其官方博客文章中表示,Nova Premier 与市面上同等的非推理模型相当,并且等于或优于大约一半的评估基准。据亚马逊称,Nova Premier 在需要深度上下文理解、多步骤规划以及跨多种工具和数据源精确执行的复杂任务上表现更佳。亚马逊白皮书中的基准对比表省略了 OpenAI 和Google的所有最新模型,似乎是为了让 Nova Premier 的表现看起来更出色。此外,亚马逊还强调,Nova Premier 是亚马逊 Bedrock 智能层级中速度最快、性价比最高的模型。在 AWS 之外,开发者可能会发现 OpenAI 的 GPT-4.1 系列和Google的 Gemini Flash 系列能够以更具竞争力的价格提供更强大的智能。Nova Premier 现已通过跨区域推理在美国东部(弗吉尼亚北部)、美国东部(俄亥俄州)和美国西部(俄勒冈州)AWS 区域的 Amazon Bedrock 中推出。 ...
PC版:https://www.cnbeta.com.tw/articles/soft/1496678.htm
手机版:https://m.cnbeta.com.tw/view/1496678.htm
cnBeta.COM
亚马逊推出Nova Premier模型 旗下最先进但性价比不高
去年,亚马逊发布了专为AmazonBedrock客户打造的全新Nova系列先进基础模型。AmazonNovaMicro、AmazonNovaLite和AmazonNovaPro是LLM,它们可以接受文本、图像和视频输入并生成文本输出。
via cnBeta.COM中文业界资讯站 - Telegram Channel
Orb设备该公司在周三晚些时候的一场活动中表示,从本周开始,美国六个城市(包括旧金山、洛杉矶和亚特兰大)的民众将能够在Tools for Humanity公司的World项目运营的特定地点以及某些合作伙伴处,使用球形的Orb设备扫描他们的眼球。此前,这项技术仅在美国进行了有限的测试。这家由联合创始人兼首席执行官亚历克斯・布拉尼亚领导的公司将Orb宣传为一种强大的工具,在AI生成的深伪内容越来越逼真的当下,它可以用来验证人们的身份,并证明某人“确实是人类”。同意进行扫描的人还可以通过该公司获得一种名为Worldcoin的加密货币代币。据该公司称,到目前为止,在菲律宾、葡萄牙和泰国等国家,已有超过1200万人使用该工具来验证自己的身份。World项目的Orb设备和这种加密货币此前也曾在香港以及肯尼亚和韩国等国家受到监管部门的审查。Tools for Humanity公司的首席架构师阿德里安・路德维希表示,在计划扩张之前,该公司已经与美国的监管机构进行了会面,但他没有透露具体是哪些监管机构。Tools for Humanity公司还表示,其收集的信息会进行加密处理,并且不会存储个人数据。除了在美国进行扩张之外,Tools for Humanity公司还宣布,它将与约会应用公司Match集团合作,开展年龄验证试点项目,首先从日本的Tinder用户开始。路德维希说:“对于消费者来说,他们不想去考虑这项技术。他们想的是:‘我想要和真实的人约会。’” ...
PC版:https://www.cnbeta.com.tw/articles/soft/1496658.htm
手机版:https://m.cnbeta.com.tw/view/1496658.htm
cnBeta.COM
验证你是否是人类:奥特曼新公司在全美正式推出眼球扫描技术
彭博社报道,由OpenAI首席执行官萨姆・奥特曼共同创立的初创公司ToolsforHumanity计划在美国各地正式推出数千台眼球扫描设备“Orb”,这标志着该公司及其新颖的身份识别服务将迎来重大扩张。
via cnBeta.COM中文业界资讯站 - Telegram Channel
马斯克被曝可能已有100多个孩子
美国《大西洋月刊》的记者伊丽莎白·布鲁尼格在上周五的一档博客节目中表示,特斯拉CEO埃隆·马斯克实际拥有的孩子数量可能已经超过100个,远远高于目前公众所知道的14个
布鲁尼格是《埃隆·马斯克的后宫》一文的作者。她说:“我相信他已知有14个孩子,但那些透露他生育习惯的人表示,这个数字要高得多。我听说有人估计有100个甚至更多。”
“这让我很惊讶,但肯定比14个要多,”布鲁尼格继续说道,“到目前为止,我想他已经和四个女人生过孩子了。让我们看看。可能是五个,再加上艾希礼·圣克莱尔,但我想是四个。”
播客联合主持人 Alisyn Camerota 还声称,与马斯克生过孩子的女性签署了保密协议。
此前,马斯克曾在𝕏邀请他人与他生子。
🗒 标签: #马斯克
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
via Yummy 😋 - Telegram Channel
美国《大西洋月刊》的记者伊丽莎白·布鲁尼格在上周五的一档博客节目中表示,特斯拉CEO埃隆·马斯克实际拥有的孩子数量可能已经超过100个,远远高于目前公众所知道的14个
布鲁尼格是《埃隆·马斯克的后宫》一文的作者。她说:“我相信他已知有14个孩子,但那些透露他生育习惯的人表示,这个数字要高得多。我听说有人估计有100个甚至更多。”
“这让我很惊讶,但肯定比14个要多,”布鲁尼格继续说道,“到目前为止,我想他已经和四个女人生过孩子了。让我们看看。可能是五个,再加上艾希礼·圣克莱尔,但我想是四个。”
播客联合主持人 Alisyn Camerota 还声称,与马斯克生过孩子的女性签署了保密协议。
此前,马斯克曾在𝕏邀请他人与他生子。
🗒 标签: #马斯克
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
via Yummy 😋 - Telegram Channel
研究指控LM Arena帮助顶级AI实验室操纵其基准测试
由Cohere、斯坦福大学、麻省理工学院以及 Ai2 的研究人员共同撰写的一项新研究指控,热门 Chatbot Arena 基准测试背后的组织LM Arena 为 Meta、OpenAI 和谷歌等主要人工智能实验室提供了不公平的优势。根据该研究,LM Arena允许某些公司在其平台上对多个模型版本进行广泛的匿名测试,随后仅发布其表现最佳模型的得分。作者声称,这种做法,加上对受青睐实验室可能更高的模型采样率,构成了 “游戏化”,扭曲了排行榜结果。LM Arena强烈反驳了该研究的说法,其联合创始人Ion Stoica称该研究“不准确”,并质疑其分析。该组织坚持其对公平、社区驱动的评估的承诺,并表示允许更多测试并不等同于对其他实验室的不公平对待。
—— TechCrunch
via 风向旗参考快讯 - Telegram Channel
由Cohere、斯坦福大学、麻省理工学院以及 Ai2 的研究人员共同撰写的一项新研究指控,热门 Chatbot Arena 基准测试背后的组织LM Arena 为 Meta、OpenAI 和谷歌等主要人工智能实验室提供了不公平的优势。根据该研究,LM Arena允许某些公司在其平台上对多个模型版本进行广泛的匿名测试,随后仅发布其表现最佳模型的得分。作者声称,这种做法,加上对受青睐实验室可能更高的模型采样率,构成了 “游戏化”,扭曲了排行榜结果。LM Arena强烈反驳了该研究的说法,其联合创始人Ion Stoica称该研究“不准确”,并质疑其分析。该组织坚持其对公平、社区驱动的评估的承诺,并表示允许更多测试并不等同于对其他实验室的不公平对待。
—— TechCrunch
via 风向旗参考快讯 - Telegram Channel
孙正义强调对美AI投资是至今最大规模
日本软银集团董事长兼社长孙正义30日出席了在美国华盛顿白宫举行的介绍特朗普执政下企业投资成果的会议。关于已宣布向人工智能领域投资5000亿美元一事,孙正义强调“作为美国的基建投资,这是至今为止最大规模”。孙正义在第二届特朗普政府上台后不久的一月,就与美国创新企业OpenAI、甲骨文公司共同宣布,计划用四年时间向生成式AI领域投资5000亿美元。孙正义在会上还表示,“这是对肩负人类未来的AI最大规模的基建投资,这一点非常重要”。美总统特朗普回应称:“正义,谢谢你!你是我的老朋友。”
—— 共同社
via 风向旗参考快讯 - Telegram Channel
日本软银集团董事长兼社长孙正义30日出席了在美国华盛顿白宫举行的介绍特朗普执政下企业投资成果的会议。关于已宣布向人工智能领域投资5000亿美元一事,孙正义强调“作为美国的基建投资,这是至今为止最大规模”。孙正义在第二届特朗普政府上台后不久的一月,就与美国创新企业OpenAI、甲骨文公司共同宣布,计划用四年时间向生成式AI领域投资5000亿美元。孙正义在会上还表示,“这是对肩负人类未来的AI最大规模的基建投资,这一点非常重要”。美总统特朗普回应称:“正义,谢谢你!你是我的老朋友。”
—— 共同社
via 风向旗参考快讯 - Telegram Channel
↩️ 谷歌确认Gemini将集成进iPhone,苹果拟支持更多第三方AI模型
谷歌确认Gemini将集成进iPhone,苹果拟支持更多第三方AI模型
在美国司法部对谷歌的反垄断审判中,谷歌CEO桑达尔·皮查伊透露,谷歌正与苹果洽谈将在iPhone中集成其AI服务Gemini,目标是在2025年年中达成协议,并有望在年底前推出。
他表示,苹果CEO蒂姆·库克已表示Apple Intelligence将在今年支持更多第三方AI模型。此次合作将类似于苹果与OpenAI的ChatGPT集成,允许Siri调用Gemini以处理更复杂的请求。预计该消息将在苹果6月9日的开发者大会上正式公布,作为iOS 19等新系统的一部分。
彭博社 | The Verge
📮投稿 ☘️频道 🌸聊天
via 科技圈🎗在花频道📮 - Telegram Channel
科技圈🎗在花频道📮:
Apple 智能 将整合谷歌Gemini模型 最新消息,苹果公司可能将为其Apple 智能引入谷歌Gemini模型支持。在iOS 18.4 Beta的后台更新中,代码挖掘者Aaron Perris发现,苹果已将“Google”和“OpenAI”列为第三方模型选项。此举表明,除了已实现的ChatGPT整合外,苹果正计划扩展与更多AI模型的合作。 9to5mac 📮投稿 ☘️频道 🌸聊天 🗞️𝕏
谷歌确认Gemini将集成进iPhone,苹果拟支持更多第三方AI模型
在美国司法部对谷歌的反垄断审判中,谷歌CEO桑达尔·皮查伊透露,谷歌正与苹果洽谈将在iPhone中集成其AI服务Gemini,目标是在2025年年中达成协议,并有望在年底前推出。
他表示,苹果CEO蒂姆·库克已表示Apple Intelligence将在今年支持更多第三方AI模型。此次合作将类似于苹果与OpenAI的ChatGPT集成,允许Siri调用Gemini以处理更复杂的请求。预计该消息将在苹果6月9日的开发者大会上正式公布,作为iOS 19等新系统的一部分。
彭博社 | The Verge
📮投稿 ☘️频道 🌸聊天
via 科技圈🎗在花频道📮 - Telegram Channel
黄仁勋警告称中国在 AI 领域“并不落后”
英伟达CEO黄仁勋周三表示,中国在人工智能领域“并不落后”,华为是“全球最强大的科技公司之一”。黄仁勋在华盛顿特区举行的一场科技会议上对记者表示,中国目前可能“稍稍落后”于美国,但差距很小。“我们非常接近。请记住,这是一场漫长的、永无止境的竞赛。”黄仁勋称。特朗普政府本月限制了未经许可向中国出口英伟达的 H20 芯片。据报道,被列入美国贸易黑名单的华为公司正在为中国客户研发自己的人工智能芯片。黄仁勋说:“他们在计算和网络技术领域表现非常出色,这些都是推动人工智能发展的必备能力。他们在过去几年里取得了巨大进步。”
—— CNBC
via 风向旗参考快讯 - Telegram Channel
英伟达CEO黄仁勋周三表示,中国在人工智能领域“并不落后”,华为是“全球最强大的科技公司之一”。黄仁勋在华盛顿特区举行的一场科技会议上对记者表示,中国目前可能“稍稍落后”于美国,但差距很小。“我们非常接近。请记住,这是一场漫长的、永无止境的竞赛。”黄仁勋称。特朗普政府本月限制了未经许可向中国出口英伟达的 H20 芯片。据报道,被列入美国贸易黑名单的华为公司正在为中国客户研发自己的人工智能芯片。黄仁勋说:“他们在计算和网络技术领域表现非常出色,这些都是推动人工智能发展的必备能力。他们在过去几年里取得了巨大进步。”
—— CNBC
via 风向旗参考快讯 - Telegram Channel
DeepSeek“五一礼包”来了 新开源模型数学推理能力大提升
DeepSeek-Prover-V2-7B:基于上一代V1.5模型,支持最长32K上下文输入;DeepSeek-Prover-V2-671B:在DeepSeek-V3-Base基础上训练,推理性能最强。*核心贡献者 †在 DeepSeek-AI 实习期间完成的工作,扫描文末二维码,进社群获取完整报告据官方论文披露,DeepSeek-Prover-V2的训练核心是“递归+强化学习”的组合:即先由DeepSeek-V3拆解复杂定理,生成一系列子目标和推理思路;再通过GRPO算法,从多种候选方案中自动学习如何选出最优解。模型特别引入了两种互补的“解题风格”:快速模式(non-CoT):专注于速度,像是一位熟练工匠,直接生成精炼的Lean代码答案,不展示思考过程,适合处理大量题目。逻辑模式(CoT):更像一个耐心的数学老师,会详细列出每一步推理过程,确保逻辑清晰、思路透明。训练过程分为两阶段,在第一阶段,研究人员主要训练快速模式,采用“专家迭代”方法:模型先尝试解决难题,成功的答案再作为新数据反哺模型,不断打磨自己的能力。待快速模式趋于稳定后,研究人员进入第二阶段,开始训练更复杂的逻辑推理能力。他们将DeepSeek-V3的数学知识迁移到新模型中,并结合形式化数据,引入“冷启动”机制,构建起更复杂的推理路径。为了进一步提升推理能力,研究人员引入了GRPO的强化学习算法,不同于传统的 PPO,它直接在多个候选答案中比较优劣,引导模型自主学会选择最优解。具体做法是:每次输入一个定理,系统会生成32个不同的证明方案,然后只保留被 Lean 验证系统判定为“正确”的答案(奖励1分,否则0分),这样模型就能在高质量反馈中不断进化。在开发出性能强大的671B模型后,DeepSeek研究团队又尝试把这些能力“蒸馏”到更小的7B模型中,而整个过程就像是师傅教徒弟:先用大模型生成解题过程,再教会小模型理解并复现;同时将小模型输入长度扩展至与大模型一致,并经历相同的强化训练。这样,即便在资源有限的设备上,用户也能使用小体积模型获得接近大模型的数学推理能力,并根据需求选择快速或详细解题风格。整个体系中,DeepSeek-V3负责拆解复杂定理,生成自然语言的推理草图,同步转译为 Lean 语言表示的一系列子目标,并生成“思路链”作为中间引导。7B模型再一步步完成子证明,最终拼接成完整推理。这种“模糊思考 + 精确证明”的训练机制,有效提升了小模型的数学理解深度。在最终性能评估中,DeepSeek-Prover-V2-671B在MiniF2F测试中实现了88.9%的通过率,成功解出PutnamBench数据集中的49道难题。与此同时,DeepSeek还同步推出了一个全新的数学形式化数据集ProverBench,共包含325道问题题目。涵盖:AIME 竞赛题(15 题)数论、代数、线性代数、微积分、实分析等多个方向这一数据集不仅包含真实的高中竞赛题目,还涵盖从基础代数、实变分析到概率论等多个本科阶段知识点,能够系统评估模型在不同数学领域的推理能力。结果显示,在15道AIME竞赛题中,DeepSeek-Prover-V2成功解出其中6道,而 DeepSeek-V3使用多数投票方式(majority voting)则解决了8道。按照官方的说法,这组对比凸显出一个重要趋势:大型语言模型在“非正式数学推理”和“正式数学推理”之间的表现差距正在明显缩小。非正式数学推理:指模型像人类一样用自然语言思考、理解并解答数学题,比如我们日常说“这道题怎么算?”的方式。它更灵活、不需要严格的逻辑形式。正式数学推理:指模型能用像Lean这样的形式语言,写出符合数学逻辑、可被验证器检验的严谨证明。它像数学论文中的证明,强调每一步推理都必须严格准确。换句话说,过去模型更像是“会算但不会写出严谨证明”。而现在,在模型结构和训练策略不断演进下,语言模型也逐步学会了写出规范、可验证的数学证明。此外,DeepSeek 宣布新模型的使用将遵循其公开许可证。https://github.com/deepseek-ai/DeepSeek-Prover-V2/blob/main/LICENSE-MODEL目前,Prover-V2系列已可通过Hugging Face平台免费下载,并支持Transformers接口部署。Novita AI是首批上线Prover-V2-671B推理服务的第三方提供商,我们也借此测试了一些问题。经典的“一根 5.5 米长的竹竿可以通过高 4 米宽 3 米的门吗?”很遗憾,结果它没答对。对于这道抽象代数,它的回答不仅正确,还能从基本定义出发,解释了什么是群同态、Z₁₂和Z₄的含义,以及同态的运算规则,显然,这对于初学者很友好。从论文所透露的方向来看,DeepSeek-Prover-V2给出的不仅是数学答案,更指明了语言模型下一阶段的可能路径。如果说过去我们关心的是大模型“能说什么”,那么在Prover-V2身上,我们得需要关注它“能证明什么”。数学只是切入口,推理才是DeepSeek这次真正下注的方向。从生成内容迈向生成结构化逻辑,这条路线不够性感,也不容易讲故事,却可能最早触碰通用人工智能的底层结构。毕竟,AI可以不懂人情世故,但它必须学会推理,因为任何知识系统的边界,归根结底都是逻辑能否闭环、以及推理能否成立。 ...
PC版:https://www.cnbeta.com.tw/articles/soft/1496604.htm
手机版:https://m.cnbeta.com.tw/view/1496604.htm
via cnBeta.COM中文业界资讯站 - Telegram Channel
DeepSeek-Prover-V2-7B:基于上一代V1.5模型,支持最长32K上下文输入;DeepSeek-Prover-V2-671B:在DeepSeek-V3-Base基础上训练,推理性能最强。*核心贡献者 †在 DeepSeek-AI 实习期间完成的工作,扫描文末二维码,进社群获取完整报告据官方论文披露,DeepSeek-Prover-V2的训练核心是“递归+强化学习”的组合:即先由DeepSeek-V3拆解复杂定理,生成一系列子目标和推理思路;再通过GRPO算法,从多种候选方案中自动学习如何选出最优解。模型特别引入了两种互补的“解题风格”:快速模式(non-CoT):专注于速度,像是一位熟练工匠,直接生成精炼的Lean代码答案,不展示思考过程,适合处理大量题目。逻辑模式(CoT):更像一个耐心的数学老师,会详细列出每一步推理过程,确保逻辑清晰、思路透明。训练过程分为两阶段,在第一阶段,研究人员主要训练快速模式,采用“专家迭代”方法:模型先尝试解决难题,成功的答案再作为新数据反哺模型,不断打磨自己的能力。待快速模式趋于稳定后,研究人员进入第二阶段,开始训练更复杂的逻辑推理能力。他们将DeepSeek-V3的数学知识迁移到新模型中,并结合形式化数据,引入“冷启动”机制,构建起更复杂的推理路径。为了进一步提升推理能力,研究人员引入了GRPO的强化学习算法,不同于传统的 PPO,它直接在多个候选答案中比较优劣,引导模型自主学会选择最优解。具体做法是:每次输入一个定理,系统会生成32个不同的证明方案,然后只保留被 Lean 验证系统判定为“正确”的答案(奖励1分,否则0分),这样模型就能在高质量反馈中不断进化。在开发出性能强大的671B模型后,DeepSeek研究团队又尝试把这些能力“蒸馏”到更小的7B模型中,而整个过程就像是师傅教徒弟:先用大模型生成解题过程,再教会小模型理解并复现;同时将小模型输入长度扩展至与大模型一致,并经历相同的强化训练。这样,即便在资源有限的设备上,用户也能使用小体积模型获得接近大模型的数学推理能力,并根据需求选择快速或详细解题风格。整个体系中,DeepSeek-V3负责拆解复杂定理,生成自然语言的推理草图,同步转译为 Lean 语言表示的一系列子目标,并生成“思路链”作为中间引导。7B模型再一步步完成子证明,最终拼接成完整推理。这种“模糊思考 + 精确证明”的训练机制,有效提升了小模型的数学理解深度。在最终性能评估中,DeepSeek-Prover-V2-671B在MiniF2F测试中实现了88.9%的通过率,成功解出PutnamBench数据集中的49道难题。与此同时,DeepSeek还同步推出了一个全新的数学形式化数据集ProverBench,共包含325道问题题目。涵盖:AIME 竞赛题(15 题)数论、代数、线性代数、微积分、实分析等多个方向这一数据集不仅包含真实的高中竞赛题目,还涵盖从基础代数、实变分析到概率论等多个本科阶段知识点,能够系统评估模型在不同数学领域的推理能力。结果显示,在15道AIME竞赛题中,DeepSeek-Prover-V2成功解出其中6道,而 DeepSeek-V3使用多数投票方式(majority voting)则解决了8道。按照官方的说法,这组对比凸显出一个重要趋势:大型语言模型在“非正式数学推理”和“正式数学推理”之间的表现差距正在明显缩小。非正式数学推理:指模型像人类一样用自然语言思考、理解并解答数学题,比如我们日常说“这道题怎么算?”的方式。它更灵活、不需要严格的逻辑形式。正式数学推理:指模型能用像Lean这样的形式语言,写出符合数学逻辑、可被验证器检验的严谨证明。它像数学论文中的证明,强调每一步推理都必须严格准确。换句话说,过去模型更像是“会算但不会写出严谨证明”。而现在,在模型结构和训练策略不断演进下,语言模型也逐步学会了写出规范、可验证的数学证明。此外,DeepSeek 宣布新模型的使用将遵循其公开许可证。https://github.com/deepseek-ai/DeepSeek-Prover-V2/blob/main/LICENSE-MODEL目前,Prover-V2系列已可通过Hugging Face平台免费下载,并支持Transformers接口部署。Novita AI是首批上线Prover-V2-671B推理服务的第三方提供商,我们也借此测试了一些问题。经典的“一根 5.5 米长的竹竿可以通过高 4 米宽 3 米的门吗?”很遗憾,结果它没答对。对于这道抽象代数,它的回答不仅正确,还能从基本定义出发,解释了什么是群同态、Z₁₂和Z₄的含义,以及同态的运算规则,显然,这对于初学者很友好。从论文所透露的方向来看,DeepSeek-Prover-V2给出的不仅是数学答案,更指明了语言模型下一阶段的可能路径。如果说过去我们关心的是大模型“能说什么”,那么在Prover-V2身上,我们得需要关注它“能证明什么”。数学只是切入口,推理才是DeepSeek这次真正下注的方向。从生成内容迈向生成结构化逻辑,这条路线不够性感,也不容易讲故事,却可能最早触碰通用人工智能的底层结构。毕竟,AI可以不懂人情世故,但它必须学会推理,因为任何知识系统的边界,归根结底都是逻辑能否闭环、以及推理能否成立。 ...
PC版:https://www.cnbeta.com.tw/articles/soft/1496604.htm
手机版:https://m.cnbeta.com.tw/view/1496604.htm
via cnBeta.COM中文业界资讯站 - Telegram Channel
Gemini 集成 GitHub,代码问答更便捷
Google Gemini 将推出 GitHub 应用扩展,继 Spotify 和 WhatsApp 后又一第三方集成。开发者可在 Gemini 中连接代码库。
用户可让 Gemini 理解代码结构、回答特定函数问题、提供代码优化建议以及协助调试程序错误,提升开发效率。
通过网页版导入仓库(限一个,有大小限制),私有库需账户关联。该集成无法获取 commit 历史或写入代码。
9to5Google
📮投稿 ☘️频道 🌸聊天
via 科技圈🎗在花频道📮 - Telegram Channel
Google Gemini 将推出 GitHub 应用扩展,继 Spotify 和 WhatsApp 后又一第三方集成。开发者可在 Gemini 中连接代码库。
用户可让 Gemini 理解代码结构、回答特定函数问题、提供代码优化建议以及协助调试程序错误,提升开发效率。
通过网页版导入仓库(限一个,有大小限制),私有库需账户关联。该集成无法获取 commit 历史或写入代码。
9to5Google
📮投稿 ☘️频道 🌸聊天
via 科技圈🎗在花频道📮 - Telegram Channel
中国科技巨头腾讯正通过将AI直接整合到微信等超级App中,重塑AI估值模式。与马斯克垂直整合的AI帝国模式不同,腾讯的策略更注重成本效益和整合速度。马斯克希望通过X和xAI的合并,打造估值超过1200亿美元的“超级App”,但X的广告收入下降,xAI的Grok模型也在企业级应用上落后于OpenAI和Anthropic。X的广告销售额预计今年将达到22.6亿美元,公司估值可能接近150亿美元。xAI的年收入预计超过1亿美元,估值可能略高于20亿美元。中国的AI估值倍数更低,腾讯的AI策略预示着整个AI行业将面临重新定价。
(FT)
via 茶馆 - Telegram Channel
英伟达CEO敦促特朗普改变AI芯片出口规则
英伟达CEO黄仁勋周三表示,他希望特朗普政府改变美国向其他国家出口人工智能技术的规定,以便美国企业能够更好地利用未来的机遇。黄仁勋表示:“我们需要加速美国AI技术在全球的扩散。政府的政策和鼓励措施确实需要支持这一点。”拜登政府已经制定了一项关于AI扩散的额外政策,即根据三个资格等级限制向世界各国销售AI技术。黄仁勋说:“我不确定新的扩散规则会是什么,但无论最终如何制定,都必须认识到自上一版扩散规则出台以来,世界已经发生了根本性变化。”他还警告称,中国正在成长为技术领域的强大竞争对手,并特别提到了华为,这家中国电信巨头已扩展到设计自己的AI芯片。
—— 彭博社
via 风向旗参考快讯 - Telegram Channel
英伟达CEO黄仁勋周三表示,他希望特朗普政府改变美国向其他国家出口人工智能技术的规定,以便美国企业能够更好地利用未来的机遇。黄仁勋表示:“我们需要加速美国AI技术在全球的扩散。政府的政策和鼓励措施确实需要支持这一点。”拜登政府已经制定了一项关于AI扩散的额外政策,即根据三个资格等级限制向世界各国销售AI技术。黄仁勋说:“我不确定新的扩散规则会是什么,但无论最终如何制定,都必须认识到自上一版扩散规则出台以来,世界已经发生了根本性变化。”他还警告称,中国正在成长为技术领域的强大竞争对手,并特别提到了华为,这家中国电信巨头已扩展到设计自己的AI芯片。
—— 彭博社
via 风向旗参考快讯 - Telegram Channel