ChatGPT / AI新闻聚合

https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN

18:24 · 2025年2月6日 · 周四

研究人员以不到50美元的价格研发出与OpenAI o1相媲美的模型

访问：https://github.com/simplescaling/s1s1背后的团队表示，他们从一个现成的基础模型开始，然后通过蒸馏对其进行微调，蒸馏是一种通过训练答案从另一个 AI 模型中提取“推理”能力的过程。研究人员表示，s1是从Google的推理模型之一 Gemini 2.0 Flash Thinking Experimental 中提炼出来的。蒸馏与伯克利研究人员上个月以大约 450 美元的价格创建 AI 推理模型的方法相同。对一些人来说，少数没有数百万美元的研究人员仍然可以在 AI 领域进行创新的想法令人兴奋。但s1提出了关于AI模型商品化的真正问题。如果有人可以用相对零钱来接近复制数百万美元的模型，那么护城河在哪里？不出所料，大型AI实验室对此并不开心。OpenAI指责DeepSeek不正当地从其API中收集数据以进行模型蒸馏。s1背后的研究人员正在寻找最简单的方法来实现强大的推理性能和“测试时扩展”，或者允许AI模型在回答问题之前进行更多思考。这些是OpenAI的o1中的一些突破，DeepSeek和其他AI实验室试图通过各种技术复制这些突破。s1论文建议，可以使用称为监督微调（SFT）的过程，通过相对较小的数据集来提炼推理模型，其中明确指示 AI 模型模仿数据集中的某些行为。SFT 往往比DeepSeek用于训练其竞争对手使用OpenAI的 o1 模型 R1 的大规模强化学习方法更便宜。Googl 通过其Google AI Studio 平台免费提供对Gemini 2.0 Flash Thinking Experimental的访问，尽管有每日速率限制。然而，Google的条款禁止对其模型进行逆向工程，以开发与公司自己的人工智能产品竞争的服务。我们已经联系了Google寻求回复。S1基于阿里巴巴拥有的中国AI实验室 Qwen 的小型现成AI模型，可免费下载。为了训练s1，研究人员创建了一个仅包含1000个精心策划的问题的数据集，并附有这些问题的答案，以及Google的 Gemini 2.0 Flash Thinking Experimental 中每个答案背后的“思考”过程。据研究人员称，在使用16个 NVIDIA H100 GPU 训练s1后，s1在某些AI基准测试中取得了出色的性能。参与该项目的斯坦福大学研究员尼克拉斯·穆尼霍夫（Niklas Muennighoff）告诉 TechCrunch，他现在可以以大约 20 美元的价格租用必要的计算设备。研究人员使用了一个巧妙的技巧让s1仔细检查它的工作并延长它的 “思考” 时间：他们告诉它等待。根据该论文，在s1的推理中添加“等待”一词有助于模型得出更准确的答案。2025 年，Meta Google和Microsoft计划在AI基础设施上投资数千亿美元，其中部分将用于训练下一代AI模型。这种水平的投资对于推动AI创新的发展可能仍然是必需的。蒸馏已被证明是一种以低成本重新创建AI模型功能的好方法，但它并没有创建比现在可用的AI模型好得多的新 AI 模型。 ...

PC版：https://www.cnbeta.com.tw/articles/soft/1476558.htm
手机版：https://m.cnbeta.com.tw/view/1476558.htm

via cnBeta.COM中文业界资讯站 - Telegram Channel

18:24 · 2025年2月6日 · 周四

研究人员使用公共广播电台的"星期日之谜"问题为AI推理模型设定基准这就是为什么一些专家认为它们是测试人工智能解决问题能力极限的一种有前途的方法。在一项新...

via cnBeta.COM中文业界资讯站 - Telegram Channel

Telegraph

研究人员使用公共广播电台的"星期日之谜"问题为AI推理模型设定基准这就是为什么一些专家认为它们是测试人工智能解决问题能…

研究人员使用公共广播电台的"星期日之谜"问题为AI推理模型设定基准这就是为什么一些专家认为它们是测试人工智能解决问题能力极限的一种有前途的方法。在一项新研究中，来自韦尔斯利学院、欧柏林学院、德克萨斯大学奥斯汀分校、东北大学和初创公司 Cursor 的研究团队利用《周日谜语》中的谜语创建了一个人工智能基准。研究团队表示，他们的测试发现了一些令人惊讶的现象，比如所谓的推理模型--OpenAI 的 o1 等--有时会"放弃"，并提供明知不正确的答案。东北大学计算机科学本科生、本研究的共同作者之一阿尔琼-古哈（Arjun…

18:24 · 2025年2月6日 · 周四

亚马逊Alexa迎来“换脑时刻”：生成式AI版本即将亮相亚马逊周三向媒体发出了2月26日在纽约举行的活动邀请函，活动将由设备和服务团队负责人帕诺斯·帕奈主持。...

via cnBeta.COM中文业界资讯站 - Telegram Channel

Telegraph

亚马逊Alexa迎来“换脑时刻”：生成式AI版本即将亮相亚马逊周三向媒体发出了2月26日在纽约举行的活动邀请函，活动将…

亚马逊Alexa迎来“换脑时刻”：生成式AI版本即将亮相亚马逊周三向媒体发出了2月26日在纽约举行的活动邀请函，活动将由设备和服务团队负责人帕诺斯·帕奈主持。一位发言人表示，此次活动以亚马逊Alexa为重点，但拒绝进一步置评。生成式A所I驱动的语音助手Alexa对于亚马逊来说既是巨大的机遇，也是巨大的风险。亚马逊拥有超过5亿台支持Alexa的终端消费电子设备，亚马逊希望通过这次升级将数亿用户中的一部分转化为付费客户，从而为这一尚未盈利的业务带来一定程度回报。据了解，这项生成式AI服务将能够依次响应多个提…

18:23 · 2025年2月6日 · 周四

奇安信预警：发现2650个山寨DeepSeek域名钓鱼欺诈窃取个人信息这些仿冒网站利用相似的域名和界面来误导用户，用来传播恶意软件、窃取个人信息或骗取订阅费用，...

via cnBeta.COM中文业界资讯站 - Telegram Channel

Telegraph

奇安信预警：发现2650个山寨DeepSeek域名钓鱼欺诈窃取个人信息这些仿冒网站利用相似的域名和界面来误导用户，用…

奇安信预警：发现2650个山寨DeepSeek域名钓鱼欺诈窃取个人信息这些仿冒网站利用相似的域名和界面来误导用户，用来传播恶意软件、窃取个人信息或骗取订阅费用，甚至出现宣称可以购买DeepSeek内部原始股的网站。这种模式与过往许多科技爆款（如 ChatGPT）在爆火后迅速出现大量仿冒和诈骗的趋势高度相似，也可能给用户带来大额财产损失。奇安信XLab实验室对2024年12月1日至2025年2月3日期间的域名注册情况进行了统计分析，发现在此期间共出现了2650个仿冒DeepSeek的网站。购买股票网站（…

17:42 · 2025年2月6日 · 周四

特斯拉招聘工程师等为量产机器人做准备

2月6日消息，特斯拉正式招聘工程师、流程主管、产品经理等多个岗位，为在加州弗里蒙特工厂量产的 Optimus (特斯拉机器人) 做准备。Optimus是特斯拉公司开发的一款人形机器人，旨在通过人工智能技术执行危险、重复或人类不愿从事的任务。1月30日，特斯拉在业绩会上更新了Optimus机器人量产指引，2025年目标生产1万台机器人，产能第一步扩至每月1000台，到2026年每月产能达到10000台，2027年每月产能达到10万台。

—— 新浪科技

via 风向旗参考快讯 - Telegram Channel

17:12 · 2025年2月6日 · 周四

ChatGPT不再强制AI搜索引擎登录账号

ChatGPT 不再要求登录才能使用人工智能聊天机器人的搜索引擎，以直接与 Google 和 Bing 等搜索引擎竞争。

Cnbeta

📮投稿 ☘️频道 🌸聊天

via 科技圈🎗在花频道📮 - Telegram Channel

17:10 · 2025年2月6日 · 周四

ChatGPT故障目前已恢复状态 📮投稿 ☘️频道 🌸聊天

ChatGPT故障

目前已恢复

状态

📮投稿☘️频道🌸聊天

via 科技圈🎗在花频道📮 - Telegram Channel

16:44 · 2025年2月6日 · 周四

🧩AI解谜能力大考：常识推理仍是挑战

一项新研究利用《周日谜语》创建AI基准，测试AI的常识推理能力。研究发现，即使是OpenAI的o1和DeepSeek的R1等推理模型，有时也会“放弃”并给出错误答案。在约600个谜语的测试中，o1的得分率为59%，o3-mini（推理强度较高）为47%，R1为35%。研究人员希望通过更广泛的基准测试，帮助改进AI模型的推理能力。

(IT业界资讯)

via 茶馆 - Telegram Channel

16:43 · 2025年2月6日 · 周四

🤖 低成本AI模型复制引争议：研究人员用450美元复刻Gemini 2.0 Flash Thinking Experimental

* 事件概述： 一个名为s1的项目，通过模型蒸馏技术，以低成本（约450美元）复制了Google的Gemini 2.0 Flash Thinking Experimental的推理能力，引发了关于AI模型商品化和知识产权的讨论。
* 技术细节： s1基于阿里巴巴的Qwen模型，使用16个NVIDIA H100 GPU和包含1000个问题的精选数据集进行训练。研究人员还发现，在推理中加入“等待”一词可以提高模型准确性。
* 争议焦点： OpenAI指责DeepSeek不正当收集其API数据进行模型蒸馏。Google的条款禁止对其模型进行逆向工程。
* 未来趋势： Meta、Google和Microsoft计划在2025年在AI基础设施上投资数千亿美元，但模型蒸馏技术可能降低AI开发的门槛。

(IT业界资讯)

via 茶馆 - Telegram Channel

15:12 · 2025年2月6日 · 周四

↩️ #AI学习资源 Karpathy 大神课2.0来了: 三个半小时 LLM 入门课程 🔝 Deep dive into LLMs like ChatGPT 想入门了解LLM必看这个视频，无技术背景要求。详细...

chatGPT中文社区:

#AI学习资源发现一个很棒的神经网络视频教程 🔝 Neural Networks: Zero to Hero Andrej Karpathy大神的神经网络课 Andrej Karpathy何许人也？他是: 🔠 多伦多大学师从Geoffrey Hinton，后者是Google Brain首席科学家，深度学习领域的开创者 🔠 在斯坦福李飞飞团队获得博士学位 🔠 OpenAI创始成员（之前我分享过他的从0到1手撸GPT的视频） 🔠 前特斯拉AI副总裁，负责重构了FSD

#AI学习资源

Karpathy 大神课2.0来了:
三个半小时 LLM 入门课程

🔝 Deep dive into LLMs like ChatGPT

想入门了解LLM必看这个视频，无技术背景要求。详细介绍 LLM 训练的全部过程，包括预训练、有监督微调和强化学习

-- 更多详情

YouTube
Deep Dive into LLMs like ChatGPT

This is a general audience deep dive into the Large Language Model (LLM) AI technology that powers ChatGPT and related products. It is covers the full training stack of how the models are developed, along with mental models of how to think about their "psychology"…

via chatGPT中文社区 - Telegram Channel

AI学习资源 AI学习资源

14:41 · 2025年2月6日 · 周四

研究员以不到50美元训练出优质推理模型

根据上周五发布的新研究论文，斯坦福大学和华盛顿大学的人工智能研究人员能够以不到50美元的云计算积分训练出具备“推理”能力的人工智能模型。该模型名为 s1，在数学和编程能力测试中表现出与 OpenAI 的 o1 和 DeepSeek 的 r1 等顶尖推理模型相似的水平。s1 模型可在 GitHub 上获取，同时还可获取用于训练该模型的数据和代码。s1 团队表示，他们从一个现成基础模型开始，然后通过“蒸馏”对其进行微调。研究人员称，s1 是从谷歌推理模型 Gemini 2.0 Flash Thinking Experimental 中蒸馏出来的。与伯克利分校的研究人员上个月以约450美元的价格创建人工智能推理模型所采用的方法相同。

—— Techcrunch、GitHub

via 风向旗参考快讯 - Telegram Channel

13:50 · 2025年2月6日 · 周四

Stable Audio - Stability Al最新推出的音乐生成工具
Stable Audio Stability Al最新推出的音乐生成工具

链接：
https://www.stableaudio.com/

#Ai工具推荐

Ai工具推荐

13:32 · 2025年2月6日 · 周四

https://mp.weixin.qq.com/s/lWbzaiIm8hRMu9xgy5NFKg

12:54 · 2025年2月6日 · 周四

小互: GPT全球宕机！

🙂

----------------------
Thu Feb 06 2025 12:35:22 GMT+0800 (China Standard Time)

via Twitter @小互

12:53 · 2025年2月6日 · 周四

小互: ↩️ 详细内容：https://www.xiaohu.ai/c/ai/s1-simple-test-time-scaling-1000-6-openai-o1-deepseek-r1-2cfec2a9-8c52-4692-86f0-5339700c6582

论文：https://arxiv.org/pdf/2501.19393

----------------------
Thu Feb 06 2025 12:24:53 GMT+0800 (China Standard Time)

via Twitter @小互

12:52 · 2025年2月6日 · 周四

小互: 炸裂！

斯坦福大学以及华盛顿大学的研究团队展示了一种极低成本的 AI 训练方法，被称为 S1。

1️⃣ S1 仅使用 6 美元就能达到 OpenAI o1-preview 级别的推理性能！同时匹敌Deepseek R1

2️⃣ 推理时间可控：S1 通过简单的“Wait”机制，控制大模型的思考时间，提高推理能力。

🔹 S1 不是 OpenAI o1 或 DeepSeek R1 的直接复刻，但它揭示了在推理时微调 AI 的潜力，甚至可以媲美 Reinforcement Learning（强化学习）。

OpenAI 和 DeepSeek 早期研究发现，AI 在回答问题时“思考得更久”，往往能得出更好的答案。但过去并没有清楚解释：如何在推理阶段控制 AI 的思考时间？

📌 S1 的创新点： S1 论文提供了推理时间扩展（Inference Scaling）的具体实现方法：

📢 核心思想：

如何在不改变 AI 训练过程的情况下，提高 AI 解决复杂问题的能力？

方法：让 AI 在推理时“多想几秒”，自动检查自己的答案，从而减少错误，提高正确率！

结果证明，这种方法比 OpenAI o1-preview 还要好！

最重要的是：而且只用了 1000 道题！这比一般 AI 训练的数据少了 800 倍，但效果仍然很强！

此外，该模型可以在笔记本电脑上运行，并且其训练成本仅为 6 美元。

----------------------
Thu Feb 06 2025 12:24:51 GMT+0800 (China Standard Time)

via Twitter @小互

12:52 · 2025年2月6日 · 周四

小互: ↩️ 详细：https://www.xiaohu.ai/c/xiaohu-ai/google-gemini-2-0-gemini-2-0-pro

----------------------
Thu Feb 06 2025 11:29:53 GMT+0800 (China Standard Time)

via Twitter @小互

12:52 · 2025年2月6日 · 周四

小互: Google 正式推出 Gemini 2.0 系列新模型包括最新的Gemini 2.0 Pro

Gemini 2.0 Flash：升级版正式开放，具有低延迟和更优性能，可在 Gemini API（Google AI Studio & Vertex AI）以及 Gemini App 中使用。

Gemini 2.0 Flash-Lite：比 Flash 1.5 更强，100 万 token 上下文窗口，支持多模态输入，并以相似成本和速度提供更高效的处理能力。

Gemini 2.0 Pro 实验版：适用于编程和复杂任务，具备更强的推理和世界知识理解能力，支持 200 万 token 上下文窗口，可分析海量信息。

----------------------
Thu Feb 06 2025 11:29:52 GMT+0800 (China Standard Time)

via Twitter @小互

Before

After