https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
💡 百度发布飞桨OCRv5:轻量高效,性能超越GPT-4o

百度在Hugging Face发布了新一代文字识别解决方案飞桨OCRv5。该模型参数量仅0.07B,具备轻量高效的特点,可在CPU及边缘设备上运行,其移动版在英特尔Xeon Gold 6271C CPU上每秒可处理超过370个字符。飞桨OCRv5采用模块化两阶段流程,在OCR特定基准测试中,其表现优于Gemini 2.5 Pro、Qwen2.5-VL和GPT-4o,支持简体中文、繁体中文、英文、日文、拼音等40余种语言,覆盖手写和印刷文本。

(科技圈)

via 茶馆 - Telegram Channel
百度发布新一代文字识别模型飞桨OCRv5:轻量高效,部分测试超越GPT-4o

百度在 Hugging Face 发布新一代文字识别解决方案飞桨OCRv5。该模型参数量仅0.07B,能在CPU及边缘设备上高效运行,其移动版在英特尔Xeon Gold 6271C CPU上每秒可处理370余字符。

飞桨OCRv5采用模块化两阶段流程,解决大型视觉语言模型在文本定位和边界框精度上的不足。在OCR特定基准测试中,其表现优于Gemini 2.5 Pro、Qwen2.5-VL和GPT-4o,覆盖手写、印刷中英文及拼音。模型支持简体中文、繁体中文、英文、日文和拼音,能识别40余种语言。

HuggingFace

🍀在花频道 🍵茶馆 📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel
思维幻象 —— AI推理模型能力深度揭示

🧠 最近读到一份来自Apple团队的研究,专门分析了当前最前沿的大型推理模型(LRMs)在复杂推理任务中的真实表现。不同于常见的数学或代码基准测试,这项研究采用了可控拼图环境,能细致拆解模型的推理过程和极限

🔍 他们发现,虽然这些AI模型在中等复杂度下表现优异,但一旦问题复杂度超过某个临界点,无论是“链式思考”模型还是普通大模型,准确率都会骤降。更有意思的是,模型在面对极高复杂度时,反而会减少推理步数,即使还有充足的计算资源

🧩 研究还揭示了不同模型在推理路径上的差异,比如在简单任务上“思考型”模型容易陷入“过度思考”,而在复杂任务中则难以自我纠错。这种细致的分析让我们重新审视AI推理能力的边界,以及未来模型设计的方向

📊 如果你关注AI推理、算法与模型极限,这篇报告值得一读。它不仅展示了AI在复杂推理面前的短板,也为我们理解“AI会不会真正思考”这个问题,提供了全新视角

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!

via Roller | AI AGENT 中文社区 - Telegram Channel
OpenAI据传大砍微软商业分成 降至8%

周五早晨,OpenAI与微软发布了一条语焉不详的联合声明,宣布双方就下一阶段合作达成了一项非约束性谅解备忘录,并且正在积极推进合同条款的敲定。根据最新爆料,在与微软敲定新合作条款的同时,OpenAI公司已告诉部分股东,未来几年其交给微软的营收比例将大幅下降。按照双方最初的合作协议,微软有权获得 OpenAI到 2030 年为止的20%收入。而根据OpenAI的最新预期,到本世纪末将与商业合作伙伴(主要是微软)分享约8%的收入。按照目前的营收测算,这两个比例之间的差额意味着OpenAI将额外保留超过 500 亿美元的收入。知情人士称,微软和OpenAI也正在就所谓的AGI条款进行谈判。

—— 财联社

via 风向旗参考快讯 - Telegram Channel
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]