https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持OpenAI, Claude, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持OpenAI, Claude, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
xAI 承诺 Grok 不会以马斯克的观点为依据
xAI公司针对其 Grok 人工智能聊天机器人的 “问题” 提供了更多修复程序,承诺该聊天机器人将不再自称为 “希特勒”,也不会依据对 xAI 负责人伊隆·马斯克言论的搜索结果来生成回应。根据今天早些时候 X 发布的一篇帖子,该聊天机器人的最新更新设定了新的指令,即其回复“必须基于你的独立分析,而非源自Grok、马斯克或 xAI 过去所宣称的任何观点。如果被问及此类偏好,请提供你自己的合理观点。”这些变化是在 Grok 经历了一周多的争议之后做出的。近日,当被问及敏感话题的看法时,该聊天机器人会先搜索马斯克对此事的看法,然后再做出回应。
—— Theverge
via 风向旗参考快讯 - Telegram Channel
xAI公司针对其 Grok 人工智能聊天机器人的 “问题” 提供了更多修复程序,承诺该聊天机器人将不再自称为 “希特勒”,也不会依据对 xAI 负责人伊隆·马斯克言论的搜索结果来生成回应。根据今天早些时候 X 发布的一篇帖子,该聊天机器人的最新更新设定了新的指令,即其回复“必须基于你的独立分析,而非源自Grok、马斯克或 xAI 过去所宣称的任何观点。如果被问及此类偏好,请提供你自己的合理观点。”这些变化是在 Grok 经历了一周多的争议之后做出的。近日,当被问及敏感话题的看法时,该聊天机器人会先搜索马斯克对此事的看法,然后再做出回应。
—— Theverge
via 风向旗参考快讯 - Telegram Channel
在第三届中国国际供应链促进博览会(以下简称“链博会”)上,英伟达创始人兼CEO黄仁勋发表演讲指出,目前已有150多万中国开发者基于NVIDIA平台创新,DeepSeek、阿里、腾讯、MiniMax、百度等领先模型在这里诞生并开源,推动全球AI发展。中国的开源AI已成为世界进步的催化剂,让每个国家、每个行业都有机会参与A革命。
“开源也是AI安全的关键,让全球合作制定标准、基准和保障措施。”在黄仁勋看来,“AI正像电力和互联网一样,成为基础设施,它正在革新供应链,改变我们设计、制造和运输一切的方式。”
据黄仁勋介绍,数百个中国项目正在英伟达Omniverse中创建数字孪生,优化工厂与仓库;机器人在虚拟世界里安全训练,再与人类在真实世界并肩工作。下一波AI是理解物理世界、能推理并执行任务的机器人系统。
“十年内,工厂将由软件和AI指挥的机器人团队运营,与人类一起打造智能产品。”黄仁勋认为,“AI将成为每个行业、每家公司、每项产品与服务的核心,为中国卓越的供应链生态系统开启新工业革命和增长机遇。”(
via cnBeta.COM - 中文业界资讯站 (author: 稿源:新浪科技)
研究发现 AI 降低了开源开发者的编程效率
2025-07-16 11:58 by 太空战
AI 公司宣称大模型能提高程序员的生产力和编程效率,但一项随机对照研究发现,AI 降低了开源开发者的编程速度。研究人员招募了 16 名有多年参与开源代码库的资深程序员,跟踪了他们维护代码库时完成 246 项任务的表现,一半任务程序员被要求使用 AI 工具如 Cursor Pro 或 Anthropic Claude,另一半任务被要求不要使用 AI 工具。在执行任务前,程序员们预测 AI 工具将帮助他们减少 24% 的工作时间,在完成任务后程序员们仍然仍然 AI 工具帮助将工作速度提高了 20%。但实际上使用 AI 工具完成任务比不使用 AI 工具完成任务慢了 19%。研究人员发现,AI 工具减少了程序员们自己写代码、测试/调试,阅读/搜索信息的时间,但增加了评估 AI 输出、提示 AI 系统和等待 AI 生成,以及空闲/额外的时间。大部分程序员表示他们需要修改 AI 生成的代码。研究人员认为,现有的 AI 工具不适合高质量标准的环境,它在编程环境中仍然有很大的局限性。
arstechnica.com/ai/2025/07/study-finds-ai-tools-made-open-source-software-developers-19-percent-slower/
#开源
via Solidot - Telegram Channel
2025-07-16 11:58 by 太空战
AI 公司宣称大模型能提高程序员的生产力和编程效率,但一项随机对照研究发现,AI 降低了开源开发者的编程速度。研究人员招募了 16 名有多年参与开源代码库的资深程序员,跟踪了他们维护代码库时完成 246 项任务的表现,一半任务程序员被要求使用 AI 工具如 Cursor Pro 或 Anthropic Claude,另一半任务被要求不要使用 AI 工具。在执行任务前,程序员们预测 AI 工具将帮助他们减少 24% 的工作时间,在完成任务后程序员们仍然仍然 AI 工具帮助将工作速度提高了 20%。但实际上使用 AI 工具完成任务比不使用 AI 工具完成任务慢了 19%。研究人员发现,AI 工具减少了程序员们自己写代码、测试/调试,阅读/搜索信息的时间,但增加了评估 AI 输出、提示 AI 系统和等待 AI 生成,以及空闲/额外的时间。大部分程序员表示他们需要修改 AI 生成的代码。研究人员认为,现有的 AI 工具不适合高质量标准的环境,它在编程环境中仍然有很大的局限性。
arstechnica.com/ai/2025/07/study-finds-ai-tools-made-open-source-software-developers-19-percent-slower/
#开源
via Solidot - Telegram Channel
Elevated Error Rate on ChatGPT
Status: Identified
We have identified that users are experiencing elevated errors for the impacted services. We are working on implementing a mitigation.
Affected components
● Codex (Degraded performance)
● File uploads (Degraded performance)
● Search (Degraded performance)
● Web (Degraded performance)
● Image Generation (Degraded performance)
● Conversations (Degraded performance)
● GPTs (Degraded performance)
● Operator (Degraded performance)
● Voice mode (Degraded performance)
● Deep Research (Degraded performance)
● Desktop - Windows (Degraded performance)
● Single Sign-On (Degraded performance)
● Login (Degraded performance)
● 1-800-CHAT-GPT (Degraded performance)
● Mobile - iOS (Degraded performance)
● Context connectors (Degraded performance)
● Dall-E (Degraded performance)
● Desktop - macOS (Degraded performance)
● Advanced Data Analysis (Degraded performance)
● Memory (Degraded performance)
● GPT vision (Degraded performance)
● Mobile - Android (Degraded performance)
● WhatsApp (Degraded performance)
via OpenAI status
Status: Identified
We have identified that users are experiencing elevated errors for the impacted services. We are working on implementing a mitigation.
Affected components
● Codex (Degraded performance)
● File uploads (Degraded performance)
● Search (Degraded performance)
● Web (Degraded performance)
● Image Generation (Degraded performance)
● Conversations (Degraded performance)
● GPTs (Degraded performance)
● Operator (Degraded performance)
● Voice mode (Degraded performance)
● Deep Research (Degraded performance)
● Desktop - Windows (Degraded performance)
● Single Sign-On (Degraded performance)
● Login (Degraded performance)
● 1-800-CHAT-GPT (Degraded performance)
● Mobile - iOS (Degraded performance)
● Context connectors (Degraded performance)
● Dall-E (Degraded performance)
● Desktop - macOS (Degraded performance)
● Advanced Data Analysis (Degraded performance)
● Memory (Degraded performance)
● GPT vision (Degraded performance)
● Mobile - Android (Degraded performance)
● WhatsApp (Degraded performance)
via OpenAI status
🚀 月之暗面发布万亿参数开源模型 Kimi K2,多项测试超越 GPT-4.1
北京月之暗面科技有限公司近日发布了其最新的混合专家模型 Kimi K2,该模型拥有惊人的 1 万亿总参数和 320 亿激活参数。在多项基准测试中,Kimi K2 表现出色,部分领域甚至超越了 OpenAI 的 GPT-4.1。
具体测试结果显示:
* 软件工程测试 (SWE-bench Verified): Kimi K2 的正确率达到 65.8%,优于大多数开源模型,并可与私有模型相媲美。
* 编程测试 (LiveCodeBench): Kimi K2 正确率为 53.7%,显著高于 DeepSeek-V3 的 46.9% 和 GPT-4.1 的 44.7%。
* 数学推理测试 (MATH-500): Kimi K2 得分为 97.4%,超过了 GPT-4.1 的 92.4%。
月之暗面表示,与 OpenAI 相比,Kimi K2 的开发成本更低,且运行速度更快、价格更具竞争力。
(科技情报)
via 茶馆 - Telegram Channel
北京月之暗面科技有限公司近日发布了其最新的混合专家模型 Kimi K2,该模型拥有惊人的 1 万亿总参数和 320 亿激活参数。在多项基准测试中,Kimi K2 表现出色,部分领域甚至超越了 OpenAI 的 GPT-4.1。
具体测试结果显示:
* 软件工程测试 (SWE-bench Verified): Kimi K2 的正确率达到 65.8%,优于大多数开源模型,并可与私有模型相媲美。
* 编程测试 (LiveCodeBench): Kimi K2 正确率为 53.7%,显著高于 DeepSeek-V3 的 46.9% 和 GPT-4.1 的 44.7%。
* 数学推理测试 (MATH-500): Kimi K2 得分为 97.4%,超过了 GPT-4.1 的 92.4%。
月之暗面表示,与 OpenAI 相比,Kimi K2 的开发成本更低,且运行速度更快、价格更具竞争力。
(科技情报)
via 茶馆 - Telegram Channel
Connectors are automatically enabled in ChatGPT
Status: Investigating
We are investigating the issue for the listed services.
Affected components
● Context connectors (Degraded performance)
via OpenAI status
Status: Investigating
We are investigating the issue for the listed services.
Affected components
● Context connectors (Degraded performance)
via OpenAI status
月之暗面发布 1 万亿参数的开源模型
2025-07-15 23:05 by 梦境救援
北京月之暗面科技有限公司上周发布了有 1 万亿总参数、320 亿激活参数的混合专家模型 Kimi K2。基准测试显示它能在部分领域打败 OpenAI 的 GPT-4.1。Kimi K2 在软件工程测试 SWE-bench Verified 中的正确率达到了 65.8%,超过了大多数开源模型,能与私有模型相媲美;在编程测试 LiveCodeBench 中,Kimi K2 的正确率达到了 53.7%,超过了 DeepSeek-V3 的 46.9% 和 GPT-4.1 的 44.7%;在数学推理测试 MATH-500 中的得分为 97.4%,超过了 GPT-4.1 的 92.4%。相比 OpenAI,月之暗面投入的成本更低,速度更快更便宜。
moonshotai.github.io/Kimi-K2/
#人工智能
via Solidot - Telegram Channel
2025-07-15 23:05 by 梦境救援
北京月之暗面科技有限公司上周发布了有 1 万亿总参数、320 亿激活参数的混合专家模型 Kimi K2。基准测试显示它能在部分领域打败 OpenAI 的 GPT-4.1。Kimi K2 在软件工程测试 SWE-bench Verified 中的正确率达到了 65.8%,超过了大多数开源模型,能与私有模型相媲美;在编程测试 LiveCodeBench 中,Kimi K2 的正确率达到了 53.7%,超过了 DeepSeek-V3 的 46.9% 和 GPT-4.1 的 44.7%;在数学推理测试 MATH-500 中的得分为 97.4%,超过了 GPT-4.1 的 92.4%。相比 OpenAI,月之暗面投入的成本更低,速度更快更便宜。
moonshotai.github.io/Kimi-K2/
#人工智能
via Solidot - Telegram Channel
据《商业内幕》报道,当顶尖AI研究人员被科技巨头招募时,他们会提出什么要求?在这方面,最近在大力挖角的Meta CEO马克·扎克伯格(Mark Zuckerberg)很有发言权。
扎克伯格
对于要跳槽的人来说,薪酬当然很重要。但是扎克伯格表示,除了钱之外,他接触到的AI人才还对另外两件事很感兴趣。
“过去,我为公司不同部门招人时,他们会问,我的职责范围有多大?” 扎克伯格周一在科技网站The Information的TITV视频节目中表示,“但现在,他们说,我希望手下管理的人越少越好,并且要给我最多的GPU。”
AI GPU是研究人员用来构建、训练和运行基础AI模型及其相关产品的芯片。在AI竞赛开启后,英伟达的H100 GPU成了炙手可热的“香饽饽”,该公司被视为AI芯片领域的领导者,之后又推出了更强大的芯片。
“从根本上来说,让每位研究人员拥有最多的算力绝对是一种战略优势,这不仅有助于完成工作,还能吸引到最优秀的人才。”扎克伯格称。
其他AI公司的招聘也证实了扎克伯格的说法。Perplexity CEO阿拉温德·斯里尼瓦斯(Aravind Srinivas)去年回忆说,他曾试图从Meta挖走一位AI研究员,却被直接拒绝。对方说:“等你有了1万块H100 GPU再来找我。”
斯里尼瓦斯表示:“你必须提供极具吸引力的激励措施,并且要确保计算资源能够迅速到位。我们这里说的可不是小型计算集群。”
目前,大型科技公司和AI创业公司都在争抢最顶尖的AI人才。Meta等公司甚至开出了数以百万美元计的薪酬方案。Meta从谷歌、Anthropic和OpenAI等竞争对手那里挖人才。OpenAI CEO萨姆·奥特曼(Sam Altman)表示,Meta向新招募的人才提供高达1亿美元的签约奖金。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:凤凰网科技)
Elevated Error Rates on Sora
Status: Identified
We have identified that users are experiencing elevated errors for the impacted services. We are working on implementing a mitigation.
Affected components
● Video generation (Degraded performance)
via OpenAI status
Status: Identified
We have identified that users are experiencing elevated errors for the impacted services. We are working on implementing a mitigation.
Affected components
● Video generation (Degraded performance)
via OpenAI status
Mistral发布首个开放AI音频模型Voxtral
法国人工智能初创公司Mistral携其首个开放模型加入音频竞赛,旨在通过开放权重替代方案挑战封闭式企业系统的主导地位。当地时间周二,Mistral宣布推出其首个面向企业的音频模型系列Voxtral。Mistral称Voxtral可转录长达30分钟的音频。由于其基础为大型语言模型Mistral Small 3.1,该模型能理解长达四十分钟的内容,允许用户就音频内容提问、生成摘要,或将语音指令转化为实时操作,例如调用API或运行函数。Voxtral 还具备多语言能力,能够转录和理解包括西班牙语、英语、法语、葡萄牙语、印地语、意大利语、德语和荷兰语在内的多种语言。
—— Techcrunch
via 风向旗参考快讯 - Telegram Channel
法国人工智能初创公司Mistral携其首个开放模型加入音频竞赛,旨在通过开放权重替代方案挑战封闭式企业系统的主导地位。当地时间周二,Mistral宣布推出其首个面向企业的音频模型系列Voxtral。Mistral称Voxtral可转录长达30分钟的音频。由于其基础为大型语言模型Mistral Small 3.1,该模型能理解长达四十分钟的内容,允许用户就音频内容提问、生成摘要,或将语音指令转化为实时操作,例如调用API或运行函数。Voxtral 还具备多语言能力,能够转录和理解包括西班牙语、英语、法语、葡萄牙语、印地语、意大利语、德语和荷兰语在内的多种语言。
—— Techcrunch
via 风向旗参考快讯 - Telegram Channel