https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
阿联酋发布能与 DeepSeek 竞争的开源模型
2025-09-14 22:37 by 龙岛
阿联酋 AI 实验室 Institute of Foundation Models (IFM) 发布了能与 OpenAI 的 ChatGPT 和 DeepSeek 竞争的开源模型 K2 Think。研究人员称,K2 Think 只有 320 亿个参数,但其表现超过了参数规模比它大 20 倍的推理模型。DeepSeek 的 R1 模型有 6710 亿个参数,但只激活 370 亿个参数;Meta 的 Llama 4 模型活跃参数从
170 亿到 2880 亿;OpenAI 没有披露其模型的参数规模。研究人员还表示,K2 Think 的数学表现超越了所有开源模型。该模型更专注于数学、编程和科学研究。IFM 此前表示它会向研究人员开放训练代码、数据集等与模型相关的材料。
mbzuai.ac.ae/news/mbzuai-and-g42-launch-k2-think-a-leading-open-source-system-for-advanced-ai-reasoning/
www.k2think.ai/k2think
huggingface.co/LLM360/K2-Think
#人工智能
via Solidot - Telegram Channel
2025-09-14 22:37 by 龙岛
阿联酋 AI 实验室 Institute of Foundation Models (IFM) 发布了能与 OpenAI 的 ChatGPT 和 DeepSeek 竞争的开源模型 K2 Think。研究人员称,K2 Think 只有 320 亿个参数,但其表现超过了参数规模比它大 20 倍的推理模型。DeepSeek 的 R1 模型有 6710 亿个参数,但只激活 370 亿个参数;Meta 的 Llama 4 模型活跃参数从
170 亿到 2880 亿;OpenAI 没有披露其模型的参数规模。研究人员还表示,K2 Think 的数学表现超越了所有开源模型。该模型更专注于数学、编程和科学研究。IFM 此前表示它会向研究人员开放训练代码、数据集等与模型相关的材料。
mbzuai.ac.ae/news/mbzuai-and-g42-launch-k2-think-a-leading-open-source-system-for-advanced-ai-reasoning/
www.k2think.ai/k2think
huggingface.co/LLM360/K2-Think
#人工智能
via Solidot - Telegram Channel
🚀 快速获取Google AI Pro Gemini学生版1年免费试用资格
论坛用户分享了一种通过`1key.me`网站绕过学生资格验证,从而快速获取Google AI Pro Gemini学生版1年免费试用资格的方法。用户需首先访问Google AI Pro Gemini学生验证页面,点击“验证资格条件”后复制生成的`services.sheerid.com`域名链接。随后,将此链接粘贴至`1key.me`网站进行验证,待显示“Verification successful!”后,返回原验证页面重新点击“验证资格条件”即可完成订阅。文章提醒,首次订阅不进行信用卡扣费验证,但建议在正式收费日期前取消订阅以避免产生费用。若旧ID无法通过验证,可尝试注册新ID。
(VPS信号)
via 茶馆 - Telegram Channel
论坛用户分享了一种通过`1key.me`网站绕过学生资格验证,从而快速获取Google AI Pro Gemini学生版1年免费试用资格的方法。用户需首先访问Google AI Pro Gemini学生验证页面,点击“验证资格条件”后复制生成的`services.sheerid.com`域名链接。随后,将此链接粘贴至`1key.me`网站进行验证,待显示“Verification successful!”后,返回原验证页面重新点击“验证资格条件”即可完成订阅。文章提醒,首次订阅不进行信用卡扣费验证,但建议在正式收费日期前取消订阅以避免产生费用。若旧ID无法通过验证,可尝试注册新ID。
(VPS信号)
via 茶馆 - Telegram Channel
OpenAI董事长称人工智能行业身处泡沫中
OpenAI董事长布雷特·泰勒表示,行业正处于AI泡沫中,许多人会损失惨重。泰勒还是AI智能体创业公司Sierra的CEO,他在近期接受了科技网站The Verge的采访,被问及是否认同OpenAI CEO萨姆·奥尔特曼所说的“有人将在AI领域损失巨额资金”。他对奥特曼的观点表示赞同,坦言行业确实身处AI泡沫之中。但是和奥尔特曼一样,他似乎对此并不是十分担忧。“我认为,AI确实会改变经济,就像互联网一样,在未来创造巨大的经济价值。同时,我也认为我们正处在一个泡沫之中,很多人会因此损失大量资金。我认为这两个判断同时成立,历史上已经有许多类似的先例证明,这两件事可以同时为真,”泰勒表示。
—— 凤凰网科技
via 风向旗参考快讯 - Telegram Channel
OpenAI董事长布雷特·泰勒表示,行业正处于AI泡沫中,许多人会损失惨重。泰勒还是AI智能体创业公司Sierra的CEO,他在近期接受了科技网站The Verge的采访,被问及是否认同OpenAI CEO萨姆·奥尔特曼所说的“有人将在AI领域损失巨额资金”。他对奥特曼的观点表示赞同,坦言行业确实身处AI泡沫之中。但是和奥尔特曼一样,他似乎对此并不是十分担忧。“我认为,AI确实会改变经济,就像互联网一样,在未来创造巨大的经济价值。同时,我也认为我们正处在一个泡沫之中,很多人会因此损失大量资金。我认为这两个判断同时成立,历史上已经有许多类似的先例证明,这两件事可以同时为真,”泰勒表示。
—— 凤凰网科技
via 风向旗参考快讯 - Telegram Channel
据9to5Google报道,Google旗下Gemini应用在美国App Store免费榜单上跃居第一,成为iPhone上最受欢迎的免费应用。这一成绩部分得益于广受欢迎的Nano Banana图像编辑模型。
截至周五晚,Gemini位列美国App Store免费榜第一位,OpenAI的ChatGPT排名第二,社交应用Threads位居第三。Google搜索App排在第六,Google地图第八,Chrome第十三,Gmail则排在第二十一。
在加拿大与英国市场,Gemini的表现同样强劲,均居榜单第二位。
自8月26日发布至9月9日短短两周,Gemini应用已新增2300万用户,Nano Banana图像编辑工具在此期间被使用超5亿次。该编辑模型因能精准保持人物特征一致性而走红,支持多张照片混合生成、风格迁移及对话化编辑等功能。
所有免费用户每天可生成或编辑最多100张图片,付费订阅用户(每月19.99美元起)每日额度则提升至1000张。
报道称,Gemini的火爆也带动了Google在iOS生态中的各类应用整体排名上升,显示出生成式AI工具在移动端继续受到强烈关注。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
💬 SQLBot - 基于大模型和 RAG 的智能问数系统
⭐️ Features
▫️开箱即用: 只需配置大模型和数据源即可开启问数之旅,通过大模型和 RAG 的结合来实现高质量的 text2sql。
▫️易于集成: 支持快速嵌入到第三方业务系统,也支持被 n8n、MaxKB、Dify、Coze 等 AI 应用开发平台集成调用,让各类应用快速拥有智能问数能力。
▫️安全可控: 提供基于工作空间的资源隔离机制,能够实现细粒度的数据权限控制。
↗️ 相关阅读
▫️Teable - 一款开源的无代码数据库
▫️SQL Chat - 一个基于聊天的 SQL 客户端▫️DB-GPT - 一个开源的以数据库为基础的 GPT 实验项目
▫️Chat2DB - 一款适用于各种数据库的智能SQL客户端和报表工具
📮投稿 📢频道 💬群聊 🔎索引
via 极客分享 - Telegram Channel
🤖 加州议会通过AI安全法案,尚待州长批准
加利福尼亚州参议院已批准一项人工智能安全法案(SB 53),该法案旨在强制开发“前沿模型”的AI公司提高透明度,并为员工提供举报保护。法案还计划设立一项名为CalCompute的公共云计划,以扩大计算资源的可及性,可能设在加州大学。
然而,该法案仍需州长加文·纽森的批准才能生效。纽森去年曾否决一项类似法案,修订后的新法案是在与加州科技政策小组协商后提出的。
根据法案,年收入低于5亿美元的AI公司虽面临审查,但其监管力度将低于收入更高的公司。该法案获得了包括Claude聊天机器人开发商Anthropic在内的一些大型AI公司的支持,其联合创始人Jack Clark认为这为AI治理提供了“坚实的蓝图”。
但也有许多公司对此表示担忧。科技投资公司Andreessen Horowitz的AI政策负责人批评此类法案“要求复杂、成本高昂的行政流程,并不能显著提高安全性,甚至可能使AI产品变得更糟”,尤其对初创公司构成负担。加州商会和TechNet等游说团体也批评法案仅关注“大型开发者”,而忽视了其他可能带来灾难性风险的先进AI模型开发者。
(PCMag.com)
via 茶馆 - Telegram Channel
加利福尼亚州参议院已批准一项人工智能安全法案(SB 53),该法案旨在强制开发“前沿模型”的AI公司提高透明度,并为员工提供举报保护。法案还计划设立一项名为CalCompute的公共云计划,以扩大计算资源的可及性,可能设在加州大学。
然而,该法案仍需州长加文·纽森的批准才能生效。纽森去年曾否决一项类似法案,修订后的新法案是在与加州科技政策小组协商后提出的。
根据法案,年收入低于5亿美元的AI公司虽面临审查,但其监管力度将低于收入更高的公司。该法案获得了包括Claude聊天机器人开发商Anthropic在内的一些大型AI公司的支持,其联合创始人Jack Clark认为这为AI治理提供了“坚实的蓝图”。
但也有许多公司对此表示担忧。科技投资公司Andreessen Horowitz的AI政策负责人批评此类法案“要求复杂、成本高昂的行政流程,并不能显著提高安全性,甚至可能使AI产品变得更糟”,尤其对初创公司构成负担。加州商会和TechNet等游说团体也批评法案仅关注“大型开发者”,而忽视了其他可能带来灾难性风险的先进AI模型开发者。
(PCMag.com)
via 茶馆 - Telegram Channel
Elevated error rates on API Platform
Status: Identified
We have identified that users are experiencing elevated errors for the impacted services. We are working on implementing a mitigation.
Affected components
● Uploads (Degraded performance)
● Realtime (Degraded performance)
● Responses (Degraded performance)
● Embeddings (Degraded performance)
● Compliance (Degraded performance)
● Images (Degraded performance)
● Batch (Degraded performance)
● Audio (Degraded performance)
● Assistants (Degraded performance)
● Fine-tuning (Degraded performance)
● Moderations (Degraded performance)
● Login (Degraded performance)
● Files (Degraded performance)
● Completions (legacy) (Degraded performance)
● Chat (Degraded performance)
via OpenAI status
Status: Identified
We have identified that users are experiencing elevated errors for the impacted services. We are working on implementing a mitigation.
Affected components
● Uploads (Degraded performance)
● Realtime (Degraded performance)
● Responses (Degraded performance)
● Embeddings (Degraded performance)
● Compliance (Degraded performance)
● Images (Degraded performance)
● Batch (Degraded performance)
● Audio (Degraded performance)
● Assistants (Degraded performance)
● Fine-tuning (Degraded performance)
● Moderations (Degraded performance)
● Login (Degraded performance)
● Files (Degraded performance)
● Completions (legacy) (Degraded performance)
● Chat (Degraded performance)
via OpenAI status
在All In峰会上,Google DeepMind首席执行官Demis Hassabis公开质疑OpenAI对GPT-5的宣传。他指出,所谓“具备博士级智能”的说法是“无稽之谈”。Hassabis强调,现有AI虽在部分任务上展现博士水准能力,但整体并不具备跨领域的通用性,更常在高中数学甚至简单计数上出错,与真正的通用人工智能仍有差距。
Hassabis表示,AI缺乏类人“持续学习”能力,仍需突破性进展,预计真正具备普遍博士水准的AI至少还需5至10年。他提醒,当前模型在复杂任务与简单常识间的落差,显示宣传过度,距离真正AGI仍遥远。
OfficeChai
🍀在花频道 🍵茶馆 📮投稿
via 科技圈🎗在花频道📮 - Telegram Channel
🤖 DeepMind CEO驳斥OpenAI“GPT-5具博士水准”说法为“无稽之谈”
在All In峰会上,Google DeepMind首席执行官Demis Hassabis公开质疑OpenAI关于GPT-5“具备博士级智能”的宣传,称其为“无稽之谈”。Hassabis指出,现有AI虽在部分任务上展现博士水准能力,但整体缺乏跨领域通用性,常在高中数学甚至简单计数上出错。他强调,AI缺乏类人“持续学习”能力,预计真正具备普遍博士水准的AI至少还需5至10年,并提醒当前模型在复杂任务与简单常识间的落差,表明其距离真正通用人工智能(AGI)仍遥远。
(科技圈)
via 茶馆 - Telegram Channel
在All In峰会上,Google DeepMind首席执行官Demis Hassabis公开质疑OpenAI关于GPT-5“具备博士级智能”的宣传,称其为“无稽之谈”。Hassabis指出,现有AI虽在部分任务上展现博士水准能力,但整体缺乏跨领域通用性,常在高中数学甚至简单计数上出错。他强调,AI缺乏类人“持续学习”能力,预计真正具备普遍博士水准的AI至少还需5至10年,并提醒当前模型在复杂任务与简单常识间的落差,表明其距离真正通用人工智能(AGI)仍遥远。
(科技圈)
via 茶馆 - Telegram Channel
💡 百度发布飞桨OCRv5:轻量高效,性能超越GPT-4o
百度在Hugging Face发布了新一代文字识别解决方案飞桨OCRv5。该模型参数量仅0.07B,具备轻量高效的特点,可在CPU及边缘设备上运行,其移动版在英特尔Xeon Gold 6271C CPU上每秒可处理超过370个字符。飞桨OCRv5采用模块化两阶段流程,在OCR特定基准测试中,其表现优于Gemini 2.5 Pro、Qwen2.5-VL和GPT-4o,支持简体中文、繁体中文、英文、日文、拼音等40余种语言,覆盖手写和印刷文本。
(科技圈)
via 茶馆 - Telegram Channel
百度在Hugging Face发布了新一代文字识别解决方案飞桨OCRv5。该模型参数量仅0.07B,具备轻量高效的特点,可在CPU及边缘设备上运行,其移动版在英特尔Xeon Gold 6271C CPU上每秒可处理超过370个字符。飞桨OCRv5采用模块化两阶段流程,在OCR特定基准测试中,其表现优于Gemini 2.5 Pro、Qwen2.5-VL和GPT-4o,支持简体中文、繁体中文、英文、日文、拼音等40余种语言,覆盖手写和印刷文本。
(科技圈)
via 茶馆 - Telegram Channel
百度在 Hugging Face 发布新一代文字识别解决方案飞桨OCRv5。该模型参数量仅0.07B,能在CPU及边缘设备上高效运行,其移动版在英特尔Xeon Gold 6271C CPU上每秒可处理370余字符。
飞桨OCRv5采用模块化两阶段流程,解决大型视觉语言模型在文本定位和边界框精度上的不足。在OCR特定基准测试中,其表现优于Gemini 2.5 Pro、Qwen2.5-VL和GPT-4o,覆盖手写、印刷中英文及拼音。模型支持简体中文、繁体中文、英文、日文和拼音,能识别40余种语言。
HuggingFace
🍀在花频道 🍵茶馆 📮投稿
via 科技圈🎗在花频道📮 - Telegram Channel
🧠 最近读到一份来自Apple团队的研究,专门分析了当前最前沿的大型推理模型(LRMs)在复杂推理任务中的真实表现。不同于常见的数学或代码基准测试,这项研究采用了可控拼图环境,能细致拆解模型的推理过程和极限
🔍 他们发现,虽然这些AI模型在中等复杂度下表现优异,但一旦问题复杂度超过某个临界点,无论是“链式思考”模型还是普通大模型,准确率都会骤降。更有意思的是,模型在面对极高复杂度时,反而会减少推理步数,即使还有充足的计算资源
🧩 研究还揭示了不同模型在推理路径上的差异,比如在简单任务上“思考型”模型容易陷入“过度思考”,而在复杂任务中则难以自我纠错。这种细致的分析让我们重新审视AI推理能力的边界,以及未来模型设计的方向
📊 如果你关注AI推理、算法与模型极限,这篇报告值得一读。它不仅展示了AI在复杂推理面前的短板,也为我们理解“AI会不会真正思考”这个问题,提供了全新视角
📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!
via Roller | AI AGENT 中文社区 - Telegram Channel