https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持Deepseek、OpenAI(o3/GPTs/Sora/实时语音)、Claude、Gemini、Midjourney、文件上传
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持Deepseek、OpenAI(o3/GPTs/Sora/实时语音)、Claude、Gemini、Midjourney、文件上传
Buy ads: https://telega.io/c/AI_News_CN
奥尔特曼投资公司在全美推出眼球扫描技术
由 OpenAI CEO 萨姆·奥尔特曼共同创立的初创公司 Tools for Humanity 计划在美国各地正式推出数千台眼球扫描设备“Orb”,这标志着该公司及其新颖的身份识别服务将迎来重大扩张。该公司在周三晚些时候的一场活动中表示,从本周开始,包括旧金山、洛杉矶和亚特兰大在内的六座美国城市的居民将能够在Tools for Humanity公司的World项目运营的特定地点以及某些合作伙伴处,使用球形的 Orb 设备扫描他们的眼球。同意扫描的人还可以通过该公司获得名为 Worldcoin 的加密货币代币。该公司还宣布,其将与约会应用公司 Match集团合作,开展年龄验证试点项目,首先从日本的Tinder用户开始。
—— 彭博社
via 风向旗参考快讯 - Telegram Channel
由 OpenAI CEO 萨姆·奥尔特曼共同创立的初创公司 Tools for Humanity 计划在美国各地正式推出数千台眼球扫描设备“Orb”,这标志着该公司及其新颖的身份识别服务将迎来重大扩张。该公司在周三晚些时候的一场活动中表示,从本周开始,包括旧金山、洛杉矶和亚特兰大在内的六座美国城市的居民将能够在Tools for Humanity公司的World项目运营的特定地点以及某些合作伙伴处,使用球形的 Orb 设备扫描他们的眼球。同意扫描的人还可以通过该公司获得名为 Worldcoin 的加密货币代币。该公司还宣布,其将与约会应用公司 Match集团合作,开展年龄验证试点项目,首先从日本的Tinder用户开始。
—— 彭博社
via 风向旗参考快讯 - Telegram Channel
马斯克被曝可能已有100多个孩子
美国《大西洋月刊》的记者伊丽莎白·布鲁尼格在上周五的一档博客节目中表示,特斯拉CEO埃隆·马斯克实际拥有的孩子数量可能已经超过100个,远远高于目前公众所知道的14个
布鲁尼格是《埃隆·马斯克的后宫》一文的作者。她说:“我相信他已知有14个孩子,但那些透露他生育习惯的人表示,这个数字要高得多。我听说有人估计有100个甚至更多。”
“这让我很惊讶,但肯定比14个要多,”布鲁尼格继续说道,“到目前为止,我想他已经和四个女人生过孩子了。让我们看看。可能是五个,再加上艾希礼·圣克莱尔,但我想是四个。”
播客联合主持人 Alisyn Camerota 还声称,与马斯克生过孩子的女性签署了保密协议。
此前,马斯克曾在𝕏邀请他人与他生子。
🗒 标签: #马斯克
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
via Yummy 😋 - Telegram Channel
美国《大西洋月刊》的记者伊丽莎白·布鲁尼格在上周五的一档博客节目中表示,特斯拉CEO埃隆·马斯克实际拥有的孩子数量可能已经超过100个,远远高于目前公众所知道的14个
布鲁尼格是《埃隆·马斯克的后宫》一文的作者。她说:“我相信他已知有14个孩子,但那些透露他生育习惯的人表示,这个数字要高得多。我听说有人估计有100个甚至更多。”
“这让我很惊讶,但肯定比14个要多,”布鲁尼格继续说道,“到目前为止,我想他已经和四个女人生过孩子了。让我们看看。可能是五个,再加上艾希礼·圣克莱尔,但我想是四个。”
播客联合主持人 Alisyn Camerota 还声称,与马斯克生过孩子的女性签署了保密协议。
此前,马斯克曾在𝕏邀请他人与他生子。
🗒 标签: #马斯克
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
via Yummy 😋 - Telegram Channel
研究指控LM Arena帮助顶级AI实验室操纵其基准测试
由Cohere、斯坦福大学、麻省理工学院以及 Ai2 的研究人员共同撰写的一项新研究指控,热门 Chatbot Arena 基准测试背后的组织LM Arena 为 Meta、OpenAI 和谷歌等主要人工智能实验室提供了不公平的优势。根据该研究,LM Arena允许某些公司在其平台上对多个模型版本进行广泛的匿名测试,随后仅发布其表现最佳模型的得分。作者声称,这种做法,加上对受青睐实验室可能更高的模型采样率,构成了 “游戏化”,扭曲了排行榜结果。LM Arena强烈反驳了该研究的说法,其联合创始人Ion Stoica称该研究“不准确”,并质疑其分析。该组织坚持其对公平、社区驱动的评估的承诺,并表示允许更多测试并不等同于对其他实验室的不公平对待。
—— TechCrunch
via 风向旗参考快讯 - Telegram Channel
由Cohere、斯坦福大学、麻省理工学院以及 Ai2 的研究人员共同撰写的一项新研究指控,热门 Chatbot Arena 基准测试背后的组织LM Arena 为 Meta、OpenAI 和谷歌等主要人工智能实验室提供了不公平的优势。根据该研究,LM Arena允许某些公司在其平台上对多个模型版本进行广泛的匿名测试,随后仅发布其表现最佳模型的得分。作者声称,这种做法,加上对受青睐实验室可能更高的模型采样率,构成了 “游戏化”,扭曲了排行榜结果。LM Arena强烈反驳了该研究的说法,其联合创始人Ion Stoica称该研究“不准确”,并质疑其分析。该组织坚持其对公平、社区驱动的评估的承诺,并表示允许更多测试并不等同于对其他实验室的不公平对待。
—— TechCrunch
via 风向旗参考快讯 - Telegram Channel
孙正义强调对美AI投资是至今最大规模
日本软银集团董事长兼社长孙正义30日出席了在美国华盛顿白宫举行的介绍特朗普执政下企业投资成果的会议。关于已宣布向人工智能领域投资5000亿美元一事,孙正义强调“作为美国的基建投资,这是至今为止最大规模”。孙正义在第二届特朗普政府上台后不久的一月,就与美国创新企业OpenAI、甲骨文公司共同宣布,计划用四年时间向生成式AI领域投资5000亿美元。孙正义在会上还表示,“这是对肩负人类未来的AI最大规模的基建投资,这一点非常重要”。美总统特朗普回应称:“正义,谢谢你!你是我的老朋友。”
—— 共同社
via 风向旗参考快讯 - Telegram Channel
日本软银集团董事长兼社长孙正义30日出席了在美国华盛顿白宫举行的介绍特朗普执政下企业投资成果的会议。关于已宣布向人工智能领域投资5000亿美元一事,孙正义强调“作为美国的基建投资,这是至今为止最大规模”。孙正义在第二届特朗普政府上台后不久的一月,就与美国创新企业OpenAI、甲骨文公司共同宣布,计划用四年时间向生成式AI领域投资5000亿美元。孙正义在会上还表示,“这是对肩负人类未来的AI最大规模的基建投资,这一点非常重要”。美总统特朗普回应称:“正义,谢谢你!你是我的老朋友。”
—— 共同社
via 风向旗参考快讯 - Telegram Channel
黄仁勋警告称中国在 AI 领域“并不落后”
英伟达CEO黄仁勋周三表示,中国在人工智能领域“并不落后”,华为是“全球最强大的科技公司之一”。黄仁勋在华盛顿特区举行的一场科技会议上对记者表示,中国目前可能“稍稍落后”于美国,但差距很小。“我们非常接近。请记住,这是一场漫长的、永无止境的竞赛。”黄仁勋称。特朗普政府本月限制了未经许可向中国出口英伟达的 H20 芯片。据报道,被列入美国贸易黑名单的华为公司正在为中国客户研发自己的人工智能芯片。黄仁勋说:“他们在计算和网络技术领域表现非常出色,这些都是推动人工智能发展的必备能力。他们在过去几年里取得了巨大进步。”
—— CNBC
via 风向旗参考快讯 - Telegram Channel
英伟达CEO黄仁勋周三表示,中国在人工智能领域“并不落后”,华为是“全球最强大的科技公司之一”。黄仁勋在华盛顿特区举行的一场科技会议上对记者表示,中国目前可能“稍稍落后”于美国,但差距很小。“我们非常接近。请记住,这是一场漫长的、永无止境的竞赛。”黄仁勋称。特朗普政府本月限制了未经许可向中国出口英伟达的 H20 芯片。据报道,被列入美国贸易黑名单的华为公司正在为中国客户研发自己的人工智能芯片。黄仁勋说:“他们在计算和网络技术领域表现非常出色,这些都是推动人工智能发展的必备能力。他们在过去几年里取得了巨大进步。”
—— CNBC
via 风向旗参考快讯 - Telegram Channel
DeepSeek“五一礼包”来了 新开源模型数学推理能力大提升
DeepSeek-Prover-V2-7B:基于上一代V1.5模型,支持最长32K上下文输入;DeepSeek-Prover-V2-671B:在DeepSeek-V3-Base基础上训练,推理性能最强。*核心贡献者 †在 DeepSeek-AI 实习期间完成的工作,扫描文末二维码,进社群获取完整报告据官方论文披露,DeepSeek-Prover-V2的训练核心是“递归+强化学习”的组合:即先由DeepSeek-V3拆解复杂定理,生成一系列子目标和推理思路;再通过GRPO算法,从多种候选方案中自动学习如何选出最优解。模型特别引入了两种互补的“解题风格”:快速模式(non-CoT):专注于速度,像是一位熟练工匠,直接生成精炼的Lean代码答案,不展示思考过程,适合处理大量题目。逻辑模式(CoT):更像一个耐心的数学老师,会详细列出每一步推理过程,确保逻辑清晰、思路透明。训练过程分为两阶段,在第一阶段,研究人员主要训练快速模式,采用“专家迭代”方法:模型先尝试解决难题,成功的答案再作为新数据反哺模型,不断打磨自己的能力。待快速模式趋于稳定后,研究人员进入第二阶段,开始训练更复杂的逻辑推理能力。他们将DeepSeek-V3的数学知识迁移到新模型中,并结合形式化数据,引入“冷启动”机制,构建起更复杂的推理路径。为了进一步提升推理能力,研究人员引入了GRPO的强化学习算法,不同于传统的 PPO,它直接在多个候选答案中比较优劣,引导模型自主学会选择最优解。具体做法是:每次输入一个定理,系统会生成32个不同的证明方案,然后只保留被 Lean 验证系统判定为“正确”的答案(奖励1分,否则0分),这样模型就能在高质量反馈中不断进化。在开发出性能强大的671B模型后,DeepSeek研究团队又尝试把这些能力“蒸馏”到更小的7B模型中,而整个过程就像是师傅教徒弟:先用大模型生成解题过程,再教会小模型理解并复现;同时将小模型输入长度扩展至与大模型一致,并经历相同的强化训练。这样,即便在资源有限的设备上,用户也能使用小体积模型获得接近大模型的数学推理能力,并根据需求选择快速或详细解题风格。整个体系中,DeepSeek-V3负责拆解复杂定理,生成自然语言的推理草图,同步转译为 Lean 语言表示的一系列子目标,并生成“思路链”作为中间引导。7B模型再一步步完成子证明,最终拼接成完整推理。这种“模糊思考 + 精确证明”的训练机制,有效提升了小模型的数学理解深度。在最终性能评估中,DeepSeek-Prover-V2-671B在MiniF2F测试中实现了88.9%的通过率,成功解出PutnamBench数据集中的49道难题。与此同时,DeepSeek还同步推出了一个全新的数学形式化数据集ProverBench,共包含325道问题题目。涵盖:AIME 竞赛题(15 题)数论、代数、线性代数、微积分、实分析等多个方向这一数据集不仅包含真实的高中竞赛题目,还涵盖从基础代数、实变分析到概率论等多个本科阶段知识点,能够系统评估模型在不同数学领域的推理能力。结果显示,在15道AIME竞赛题中,DeepSeek-Prover-V2成功解出其中6道,而 DeepSeek-V3使用多数投票方式(majority voting)则解决了8道。按照官方的说法,这组对比凸显出一个重要趋势:大型语言模型在“非正式数学推理”和“正式数学推理”之间的表现差距正在明显缩小。非正式数学推理:指模型像人类一样用自然语言思考、理解并解答数学题,比如我们日常说“这道题怎么算?”的方式。它更灵活、不需要严格的逻辑形式。正式数学推理:指模型能用像Lean这样的形式语言,写出符合数学逻辑、可被验证器检验的严谨证明。它像数学论文中的证明,强调每一步推理都必须严格准确。换句话说,过去模型更像是“会算但不会写出严谨证明”。而现在,在模型结构和训练策略不断演进下,语言模型也逐步学会了写出规范、可验证的数学证明。此外,DeepSeek 宣布新模型的使用将遵循其公开许可证。https://github.com/deepseek-ai/DeepSeek-Prover-V2/blob/main/LICENSE-MODEL目前,Prover-V2系列已可通过Hugging Face平台免费下载,并支持Transformers接口部署。Novita AI是首批上线Prover-V2-671B推理服务的第三方提供商,我们也借此测试了一些问题。经典的“一根 5.5 米长的竹竿可以通过高 4 米宽 3 米的门吗?”很遗憾,结果它没答对。对于这道抽象代数,它的回答不仅正确,还能从基本定义出发,解释了什么是群同态、Z₁₂和Z₄的含义,以及同态的运算规则,显然,这对于初学者很友好。从论文所透露的方向来看,DeepSeek-Prover-V2给出的不仅是数学答案,更指明了语言模型下一阶段的可能路径。如果说过去我们关心的是大模型“能说什么”,那么在Prover-V2身上,我们得需要关注它“能证明什么”。数学只是切入口,推理才是DeepSeek这次真正下注的方向。从生成内容迈向生成结构化逻辑,这条路线不够性感,也不容易讲故事,却可能最早触碰通用人工智能的底层结构。毕竟,AI可以不懂人情世故,但它必须学会推理,因为任何知识系统的边界,归根结底都是逻辑能否闭环、以及推理能否成立。 ...
PC版:https://www.cnbeta.com.tw/articles/soft/1496604.htm
手机版:https://m.cnbeta.com.tw/view/1496604.htm
via cnBeta.COM中文业界资讯站 - Telegram Channel
DeepSeek-Prover-V2-7B:基于上一代V1.5模型,支持最长32K上下文输入;DeepSeek-Prover-V2-671B:在DeepSeek-V3-Base基础上训练,推理性能最强。*核心贡献者 †在 DeepSeek-AI 实习期间完成的工作,扫描文末二维码,进社群获取完整报告据官方论文披露,DeepSeek-Prover-V2的训练核心是“递归+强化学习”的组合:即先由DeepSeek-V3拆解复杂定理,生成一系列子目标和推理思路;再通过GRPO算法,从多种候选方案中自动学习如何选出最优解。模型特别引入了两种互补的“解题风格”:快速模式(non-CoT):专注于速度,像是一位熟练工匠,直接生成精炼的Lean代码答案,不展示思考过程,适合处理大量题目。逻辑模式(CoT):更像一个耐心的数学老师,会详细列出每一步推理过程,确保逻辑清晰、思路透明。训练过程分为两阶段,在第一阶段,研究人员主要训练快速模式,采用“专家迭代”方法:模型先尝试解决难题,成功的答案再作为新数据反哺模型,不断打磨自己的能力。待快速模式趋于稳定后,研究人员进入第二阶段,开始训练更复杂的逻辑推理能力。他们将DeepSeek-V3的数学知识迁移到新模型中,并结合形式化数据,引入“冷启动”机制,构建起更复杂的推理路径。为了进一步提升推理能力,研究人员引入了GRPO的强化学习算法,不同于传统的 PPO,它直接在多个候选答案中比较优劣,引导模型自主学会选择最优解。具体做法是:每次输入一个定理,系统会生成32个不同的证明方案,然后只保留被 Lean 验证系统判定为“正确”的答案(奖励1分,否则0分),这样模型就能在高质量反馈中不断进化。在开发出性能强大的671B模型后,DeepSeek研究团队又尝试把这些能力“蒸馏”到更小的7B模型中,而整个过程就像是师傅教徒弟:先用大模型生成解题过程,再教会小模型理解并复现;同时将小模型输入长度扩展至与大模型一致,并经历相同的强化训练。这样,即便在资源有限的设备上,用户也能使用小体积模型获得接近大模型的数学推理能力,并根据需求选择快速或详细解题风格。整个体系中,DeepSeek-V3负责拆解复杂定理,生成自然语言的推理草图,同步转译为 Lean 语言表示的一系列子目标,并生成“思路链”作为中间引导。7B模型再一步步完成子证明,最终拼接成完整推理。这种“模糊思考 + 精确证明”的训练机制,有效提升了小模型的数学理解深度。在最终性能评估中,DeepSeek-Prover-V2-671B在MiniF2F测试中实现了88.9%的通过率,成功解出PutnamBench数据集中的49道难题。与此同时,DeepSeek还同步推出了一个全新的数学形式化数据集ProverBench,共包含325道问题题目。涵盖:AIME 竞赛题(15 题)数论、代数、线性代数、微积分、实分析等多个方向这一数据集不仅包含真实的高中竞赛题目,还涵盖从基础代数、实变分析到概率论等多个本科阶段知识点,能够系统评估模型在不同数学领域的推理能力。结果显示,在15道AIME竞赛题中,DeepSeek-Prover-V2成功解出其中6道,而 DeepSeek-V3使用多数投票方式(majority voting)则解决了8道。按照官方的说法,这组对比凸显出一个重要趋势:大型语言模型在“非正式数学推理”和“正式数学推理”之间的表现差距正在明显缩小。非正式数学推理:指模型像人类一样用自然语言思考、理解并解答数学题,比如我们日常说“这道题怎么算?”的方式。它更灵活、不需要严格的逻辑形式。正式数学推理:指模型能用像Lean这样的形式语言,写出符合数学逻辑、可被验证器检验的严谨证明。它像数学论文中的证明,强调每一步推理都必须严格准确。换句话说,过去模型更像是“会算但不会写出严谨证明”。而现在,在模型结构和训练策略不断演进下,语言模型也逐步学会了写出规范、可验证的数学证明。此外,DeepSeek 宣布新模型的使用将遵循其公开许可证。https://github.com/deepseek-ai/DeepSeek-Prover-V2/blob/main/LICENSE-MODEL目前,Prover-V2系列已可通过Hugging Face平台免费下载,并支持Transformers接口部署。Novita AI是首批上线Prover-V2-671B推理服务的第三方提供商,我们也借此测试了一些问题。经典的“一根 5.5 米长的竹竿可以通过高 4 米宽 3 米的门吗?”很遗憾,结果它没答对。对于这道抽象代数,它的回答不仅正确,还能从基本定义出发,解释了什么是群同态、Z₁₂和Z₄的含义,以及同态的运算规则,显然,这对于初学者很友好。从论文所透露的方向来看,DeepSeek-Prover-V2给出的不仅是数学答案,更指明了语言模型下一阶段的可能路径。如果说过去我们关心的是大模型“能说什么”,那么在Prover-V2身上,我们得需要关注它“能证明什么”。数学只是切入口,推理才是DeepSeek这次真正下注的方向。从生成内容迈向生成结构化逻辑,这条路线不够性感,也不容易讲故事,却可能最早触碰通用人工智能的底层结构。毕竟,AI可以不懂人情世故,但它必须学会推理,因为任何知识系统的边界,归根结底都是逻辑能否闭环、以及推理能否成立。 ...
PC版:https://www.cnbeta.com.tw/articles/soft/1496604.htm
手机版:https://m.cnbeta.com.tw/view/1496604.htm
via cnBeta.COM中文业界资讯站 - Telegram Channel
Gemini 集成 GitHub,代码问答更便捷
Google Gemini 将推出 GitHub 应用扩展,继 Spotify 和 WhatsApp 后又一第三方集成。开发者可在 Gemini 中连接代码库。
用户可让 Gemini 理解代码结构、回答特定函数问题、提供代码优化建议以及协助调试程序错误,提升开发效率。
通过网页版导入仓库(限一个,有大小限制),私有库需账户关联。该集成无法获取 commit 历史或写入代码。
9to5Google
📮投稿 ☘️频道 🌸聊天
via 科技圈🎗在花频道📮 - Telegram Channel
Google Gemini 将推出 GitHub 应用扩展,继 Spotify 和 WhatsApp 后又一第三方集成。开发者可在 Gemini 中连接代码库。
用户可让 Gemini 理解代码结构、回答特定函数问题、提供代码优化建议以及协助调试程序错误,提升开发效率。
通过网页版导入仓库(限一个,有大小限制),私有库需账户关联。该集成无法获取 commit 历史或写入代码。
9to5Google
📮投稿 ☘️频道 🌸聊天
via 科技圈🎗在花频道📮 - Telegram Channel
中国科技巨头腾讯正通过将AI直接整合到微信等超级App中,重塑AI估值模式。与马斯克垂直整合的AI帝国模式不同,腾讯的策略更注重成本效益和整合速度。马斯克希望通过X和xAI的合并,打造估值超过1200亿美元的“超级App”,但X的广告收入下降,xAI的Grok模型也在企业级应用上落后于OpenAI和Anthropic。X的广告销售额预计今年将达到22.6亿美元,公司估值可能接近150亿美元。xAI的年收入预计超过1亿美元,估值可能略高于20亿美元。中国的AI估值倍数更低,腾讯的AI策略预示着整个AI行业将面临重新定价。
(FT)
via 茶馆 - Telegram Channel
英伟达CEO敦促特朗普改变AI芯片出口规则
英伟达CEO黄仁勋周三表示,他希望特朗普政府改变美国向其他国家出口人工智能技术的规定,以便美国企业能够更好地利用未来的机遇。黄仁勋表示:“我们需要加速美国AI技术在全球的扩散。政府的政策和鼓励措施确实需要支持这一点。”拜登政府已经制定了一项关于AI扩散的额外政策,即根据三个资格等级限制向世界各国销售AI技术。黄仁勋说:“我不确定新的扩散规则会是什么,但无论最终如何制定,都必须认识到自上一版扩散规则出台以来,世界已经发生了根本性变化。”他还警告称,中国正在成长为技术领域的强大竞争对手,并特别提到了华为,这家中国电信巨头已扩展到设计自己的AI芯片。
—— 彭博社
via 风向旗参考快讯 - Telegram Channel
英伟达CEO黄仁勋周三表示,他希望特朗普政府改变美国向其他国家出口人工智能技术的规定,以便美国企业能够更好地利用未来的机遇。黄仁勋表示:“我们需要加速美国AI技术在全球的扩散。政府的政策和鼓励措施确实需要支持这一点。”拜登政府已经制定了一项关于AI扩散的额外政策,即根据三个资格等级限制向世界各国销售AI技术。黄仁勋说:“我不确定新的扩散规则会是什么,但无论最终如何制定,都必须认识到自上一版扩散规则出台以来,世界已经发生了根本性变化。”他还警告称,中国正在成长为技术领域的强大竞争对手,并特别提到了华为,这家中国电信巨头已扩展到设计自己的AI芯片。
—— 彭博社
via 风向旗参考快讯 - Telegram Channel