https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
在 AI 巨头们疯狂堆料、追逐跑分巅峰的当下,马斯克旗下的 xAI 却另辟蹊径,试图解决 AI 领域最令人头疼的“一本正经胡说八道”问题。今日,xAI 正式发布了 Grok4.20Beta。尽管在绝对智力跑分上它仍与顶级梯队保持距离,但在“诚实度”这一关键指标上,它却刷新了行业纪录。
根据 Artificial Analysis 的最新评测,Grok4.20在推理模式下的智力指数分数为48,虽然落后于和(两者均为57),但其在事实可靠性上的表现极其惊人:
● 最低幻觉率:在 AA Omniscience 测试中,Grok4.20达到了 78% 的“非幻觉率”,创下历史新高。
● 知之为知之:该模型在面对无法回答的问题时,不再倾向于编造虚假事实,而是能更准确地承认“我不知道”。这种“诚实”对于严谨的办公和研究场景至关重要。
技术架构:三位一体的 API 矩阵
为了满足不同层级的需求,xAI 此次推出了三种 API 变体:
推理模式(Reasoning):牺牲速度换取深度逻辑思考,是此次打破幻觉记录的核心。
标准模式(Non-reasoning):侧重于快速响应与常规交互。
多智能体模式(Multi-agent):支持多个 AI 实例协同处理复杂任务。
市场策略:加量不加价
除了性能上的独特性,Grok4.20在商业逻辑上也极具攻击性:
● 海量上下文:支持高达 200万 token 的上下文窗口,能够一次性吞下整本书或海量代码库。
● 价格优势:其定价定在每百万 token2至6美元之间,不仅比前代 Grok4更便宜,在目前的西方主流模型中也极具竞争力。
Grok4.20的发布反映出 xAI 战略的转变——不再执着于在通往 AGI 的总分跑道上死磕,而是精准切入“企业级可靠性”这一痛点。正如测评机构所言,如果说其他模型是在努力成为“全知全能的先知”,那么 Grok4.20则在努力成为一个“绝不撒谎的助手”。
对于那些对数据准确性有极高要求的用户来说,Grok4.20或将成为除 OpenAI 和谷歌之外的第三个重量级选项。
via AI新闻资讯 (author: AI Base)
在信息爆炸的今天,面对动辄万字的深度长文,你是否也渴望有一个随叫随到的“私人秘书”?近日,一款名为 AI 页面总结器 的浏览器扩展正式上线微软 Edge 商店。它的出现,标志着网页阅读正式进入了“本地大模型”时代。
这款扩展最硬核的地方在于其极其强悍的兼容性。它不仅支持 DeepSeek、豆包、Gitee AI 等主流在线模型,更通过对接 Ollama 和 Docker Desktop AI,实现了对本地大模型的完美支持。这意味着,即便在没有网络或者对隐私极度敏感的场景下,你依然可以调用本地算力,一键生成网页精简摘要。
在功能设计上,AI 页面总结器 采用了侧边栏对话框的形式。这不仅仅是一个简单的“总结工具”,更是一个支持多轮追问的 AI 助手。你可以针对总结内容进行深度挖掘,或者让它基于当前页面上下文进行翻译和理解。为了解决大模型普遍存在的“断句”痛点,它还贴心地支持了长文本自动截断(最高15000字符)以及全 Markdown 渲染。
对于开发者和极客用户来说,这款工具的“保姆级”自动化更是加分项。比如在使用 Ollama 时,系统能自动拉取并动态切换模型,真正做到了“免配置、开箱即用”。
目前,该插件已经在 微软 Edge 商店 开放获取。在这个“算力下乡”的时代,能把顶尖大模型装进浏览器侧边栏,或许就是我们对抗信息焦虑的最好武器。
via AI新闻资讯 (author: AI Base)
近日,全球脑机接口领域迎来里程碑式突破。国家药监局正式批准了博睿康医疗科技(上海)有限公司研发的“植入式脑机接口手部运动功能代偿系统”创新产品注册申请。这不仅实现了该类医疗器械的全球首发上市,更标志着国际首个侵入式脑机接口医疗器械正式跨入临床应用阶段。
核心技术与系统构成
该系统采用硬脑膜外微创植入与无线供能通信技术,平衡了信号质量与手术安全性。全套产品由八大核心组分构成:
● 硬件端: 脑机接口植入体、植入式脑电电极套件、脑电信号收发器、气动手套设备。
● 软件与配套: 脑电解码软件、医用测试软件、临床管理软件,以及专用的一次性手术工具包。
适用人群与临床表现
该产品精准针对颈段脊髓损伤导致的四肢瘫患者。通过采集大脑运动意图并驱动气动手套,辅助患者实现手部抓握功能的代偿。申请使用的患者需满足以下严苛条件:
1. 年龄与病史:18至60岁,确诊超过1年且病情稳定至少6个月。
2. 损伤程度: C2~C6颈段脊髓损伤,评级为A~C级的四肢瘫。
3. 身体指征: 手部完全无法抓握,但上臂尚存部分功能。
临床试验结果证实,受试者在植入该系统后,手部抓握能力显著提升,极大地改善了日常生活自理能力。这一“从0到1”的突破,填补了国际临床空白,预示着脑机接口技术正式从实验室走向诊疗室。
via AI新闻资讯 (author: AI Base)
Meta 拟推迟发布 AI 模型 Avocado,因为性能竞争落后于对手模型
Meta 据称已将其代号为“Avocado”的新型人工智能模型发布时间从原定的 3 月推迟至 5 月后。据透露,在 Meta 投入上百亿资金并研发了数个月后,该模型性能仍介于谷歌 Gemini 2.5 与 Gemini 3 之间,落后于竞争对手。
Meta 今年计划继续投入 1150 亿至 1350 亿美元用于 AI 研发。Meta 发言人对此模型进展称: 推出的新模型将会展示其快速发展的轨迹,公司上下对此充满了信心。
Reuters
🍀在花频道 🍵茶馆聊天 📮投稿
via 科技圈🎗在花频道📮 - Telegram Channel
Meta 据称已将其代号为“Avocado”的新型人工智能模型发布时间从原定的 3 月推迟至 5 月后。据透露,在 Meta 投入上百亿资金并研发了数个月后,该模型性能仍介于谷歌 Gemini 2.5 与 Gemini 3 之间,落后于竞争对手。
Meta 今年计划继续投入 1150 亿至 1350 亿美元用于 AI 研发。Meta 发言人对此模型进展称: 推出的新模型将会展示其快速发展的轨迹,公司上下对此充满了信心。
Reuters
🍀在花频道 🍵茶馆聊天 📮投稿
via 科技圈🎗在花频道📮 - Telegram Channel
🔁 #Update #GitHubCopilot
Forwarded From Agent Copilot
#Update #GitHubCopilot
GitHub Copilot Student Plan 的高级模型(如GPT-5.4、Claude Opus)将不再可用。
via AI Copilot - Telegram Channel
Forwarded From Agent Copilot
#Update #GitHubCopilot
GitHub Copilot Student Plan 的高级模型(如GPT-5.4、Claude Opus)将不再可用。
via AI Copilot - Telegram Channel
未雨绸缪:Anthropic 成立官方智库,应对 AGI 时代的社会冲击
随着人工智能进化速度远超行业预期,AI 安全领域的先驱于美国当地时间 11 日正式宣布成立 Anthropic Institute 智库。这一组织的使命并非研发更强大的模型,而是专门研究并应对“强大 AI”可能给人类社会带来的深层挑战与严峻风险。
预测,未来两年内人工智能将迎来突破性进展,甚至可能比大多数人想象中更早触及通用人工智能(AGI)的边缘。为此,新成立的智库将重点聚焦以下四大关键领域:
● 就业与经济变革:研究 AI 自动化对全球劳动力市场的重塑及应对机制。
● 威胁与防御韧性:防范 AI 技术被滥用于生物安全、网络攻击等高危领域,增强社会防御能力。
● AI 价值观对齐:如何确保前沿 AI 系统的决策符合人类的伦理标准与社会公共利益。
● 自循环治理体系:探索 AI 在自我监督与自演化过程中的透明度与合规管理。
的目标是打破技术巨头内部的封闭性。它将作为桥梁,向公众和决策机构分享在构建前沿系统过程中遇到的真实技术挑战,并与外部科研机构、政策制定者及民间社会组织深度合作,共同制定应对方案。
近期的商业表现极为抢眼,有消息称其,旗下模型日增用户超百万。然而,在算力与财富激增的背后,始终维持其“安全优先”的企业底色。
via AI新闻资讯 (author: AI Base)
随着人工智能进化速度远超行业预期,AI 安全领域的先驱于美国当地时间 11 日正式宣布成立 Anthropic Institute 智库。这一组织的使命并非研发更强大的模型,而是专门研究并应对“强大 AI”可能给人类社会带来的深层挑战与严峻风险。
预测,未来两年内人工智能将迎来突破性进展,甚至可能比大多数人想象中更早触及通用人工智能(AGI)的边缘。为此,新成立的智库将重点聚焦以下四大关键领域:
● 就业与经济变革:研究 AI 自动化对全球劳动力市场的重塑及应对机制。
● 威胁与防御韧性:防范 AI 技术被滥用于生物安全、网络攻击等高危领域,增强社会防御能力。
● AI 价值观对齐:如何确保前沿 AI 系统的决策符合人类的伦理标准与社会公共利益。
● 自循环治理体系:探索 AI 在自我监督与自演化过程中的透明度与合规管理。
的目标是打破技术巨头内部的封闭性。它将作为桥梁,向公众和决策机构分享在构建前沿系统过程中遇到的真实技术挑战,并与外部科研机构、政策制定者及民间社会组织深度合作,共同制定应对方案。
近期的商业表现极为抢眼,有消息称其,旗下模型日增用户超百万。然而,在算力与财富激增的背后,始终维持其“安全优先”的企业底色。
via AI新闻资讯 (author: AI Base)
据知情人士称,美国科技巨头Meta已将其代号为“Avocado”的人工智能模型的发布时间从本月推迟到至少5月份。
尽管该公司正大力投资以拓展其人工智能领域的雄心壮志,包括制定自主芯片研发路线图,但其人工智能项目的时间表仍然有所延迟。今年1月,Meta公布了其年度资本支出计划,目标是实现“超级智能”——即人工智能超越人类智能的愿景。
消息人士称,Meta耗时数月研发的这款新模型与竞争对手的最新产品相比,性能表现欠佳。
消息人士还称,Meta人工智能部门的领导层已讨论过暂时获得谷歌Gemini的授权,以支持公司人工智能产品的可能性,但尚未做出任何决定。
去年12月有报道称,Meta正在开发一款代号为Avocado的文本 AI 模型,计划于第一季度发布。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
马斯克的人工智能初创公司xAI最近经历了一系列高层人事变动,在戴子航和张国栋离职后,xAI的11名创始成员中只剩下两人仍在公司任职,分别是Manuel Kroiss和Ross Nordeen。
当地时间周四,有报道称xAI从Cursor挖来两名高管,分别是Jason Ginsberg和Andrew Milich。
马斯克在社交平台X上回应网友对这一事件的评论时称:“xAI最初构建时并不完善,因此正从基础开始进行重新构建。特斯拉也经历了同样的情况。”
相关文章:
马斯克旗下xAI面临联合创始人离职潮 11名创始人仅剩2人在岗
via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
#AI编程
CursorBench:基于真实对话的编程 Agent 基准测试
Cursor 认为目前公开的编程 Agent 基准测试已经存在明显局限性:如饱和严重、数据污染、与真实体验脱节等
所以 Cursor 自己做了一套基准测试,数据基于 Cursor 工程团队真实使用会话,所以更贴近实际,而非像小米一样的 PPT 数据
⭐ GPT 5.4 遥遥领先!
📮投稿 📢频道 💬群聊 🔎索引
via 极客分享 - Telegram Channel
3 年狂卖 20 亿!京东联手海尔在AWE现场“搞事情”:AI厨房真的要接管你的胃了
在 AWE 2026 的火爆现场,家电巨头与电商平台的一次握手,揭开了未来三年厨房进化的序幕。 3 月 12 日下午,海尔小家电与京东厨小在上海新国际博览中心正式签署战略合作协议。双方立下了一个惊人的“军令状”:要在未来三年内,在京东全渠道实现 20 亿元 的销售总额。
这不仅仅是一次简单的卖货协议,更是一场关于“大平台×大品牌×大AI”的深度化学反应。过去,智能厨房可能只是能连网的电饭煲;而现在,海尔计划依托其深厚的 AI 布局,结合京东的海量消费大数据和全渠道渗透力,把厨房从一个“做饭的地方”变成一个“懂你的生态”。
这套 AI 厨房解决方案的核心逻辑非常清晰:通过大模型感知用户的饮食需求,重构烹饪场景。简单来说,AI 不再只是冷冰冰的指令,而是能根据你的口味、身体状态甚至食材储备,主动为你提供个性化的饮食建议。
随着京东与海尔这对“黄金搭档”的深度捆绑,AI 厨房赛道的竞争正式进入了深水区。20 亿的销售目标背后,是两家大厂对 AI 改变生活方式的坚定信心。当 AI 真正接管了柴米油盐,那个“饭来张口”的科幻未来,似乎已经近在咫尺了。
via AI新闻资讯 (author: AI Base)
在 AWE 2026 的火爆现场,家电巨头与电商平台的一次握手,揭开了未来三年厨房进化的序幕。 3 月 12 日下午,海尔小家电与京东厨小在上海新国际博览中心正式签署战略合作协议。双方立下了一个惊人的“军令状”:要在未来三年内,在京东全渠道实现 20 亿元 的销售总额。
这不仅仅是一次简单的卖货协议,更是一场关于“大平台×大品牌×大AI”的深度化学反应。过去,智能厨房可能只是能连网的电饭煲;而现在,海尔计划依托其深厚的 AI 布局,结合京东的海量消费大数据和全渠道渗透力,把厨房从一个“做饭的地方”变成一个“懂你的生态”。
这套 AI 厨房解决方案的核心逻辑非常清晰:通过大模型感知用户的饮食需求,重构烹饪场景。简单来说,AI 不再只是冷冰冰的指令,而是能根据你的口味、身体状态甚至食材储备,主动为你提供个性化的饮食建议。
随着京东与海尔这对“黄金搭档”的深度捆绑,AI 厨房赛道的竞争正式进入了深水区。20 亿的销售目标背后,是两家大厂对 AI 改变生活方式的坚定信心。当 AI 真正接管了柴米油盐,那个“饭来张口”的科幻未来,似乎已经近在咫尺了。
via AI新闻资讯 (author: AI Base)
据报道,百度健康近日正式启动面向医生的专业AI智能助手内测,该产品内部代号为“DoctorClaw”(龙虾医生版),标志着百度在医疗垂直领域大模型的应用落地进入关键阶段。
据知情人士透露,该项目目前处于封闭开发后的内测期,尽管具体产品形态尚未完全公开,但已临近上线。在功能设定上,DoctorClaw短期内将聚焦于学术文献检索与日常办公辅助,而其长期战略目标则是深度渗透临床诊疗、医学科研及教学管理等全场景需求,打造安全可控的数字化医疗专家助手。
此次内测正值“龙虾”概念在AI圈迅速走红之际,近期市场上涌现出包括OpenClaw及各类“养虾”助手在内的多元AI应用,引发了从算力消耗到行业标准的热议。在此背景下,百度健康切入医生侧专业赛道,不仅是对现有医疗数字化工具的补充,更是试图通过专业级AI能力解决临床效率瓶颈。
在当前医疗大模型从“通用”向“专精”转型的趋势下,DoctorClaw的内测预示着行业竞争正由C端问诊向专业壁垒更高的B端执业辅助偏移。若该产品能成功克服医疗数据的安全性与决策的精准性挑战,将有望重塑数字化医疗的工作流。
via AI新闻资讯 (author: AI Base)
谷歌承诺已久的 AI 愿景正随着的发布正式照进现实。今日,联合宣布,基于 Gemini 的“任务自动化”功能已进入 Beta 测试阶段。这一功能标志着 AI 助手从单纯的“信息查询员”转型为具备跨应用执行能力的“数字代办”,能够模拟人类操作完成订餐、打车等复杂流程。
视觉震撼:看着手机“自己用自己”
与传统的 API 对接不同,的自动化功能是在一个虚拟窗口中模拟真实的用户操作:
● 智能打车:当你给出“打车去机场”的指令,会自动唤起 Uber,确认具体的航站楼(如遇多航站楼会主动询问),并自动填入目的地。
● 代订餐食:在处理“帮我点一杯咖啡和牛角包”的指令时,AI 会自主划动屏幕寻找星巴克菜单中的特定单品(如 Flat White),甚至能像人类一样处理复杂的滚动选择。
安全逻辑:关键节点,人类掌舵
为了规避自主权带来的风险,谷歌在自动化流程中设置了严密的人工复核机制:
显式操作:用户可以实时观看的每一步动作,并随时通过“Take control”接管或终止自动化进程。
最后确认制:在最终提交订单或付款前,系统会强制停在支付界面,等待用户核实明细并手动点击“确认”,确保每一笔交易都在受控状态下完成
目前,该功能已优先适配外卖配送与网约车类应用。对于及后续用户而言,手机不再仅仅是运行 App 的载体,而是一个能够理解自然语言意图并将其转化为具体操作的“超级代理”。
尽管 AI 在菜单滚动和选项识别上偶尔还显得有些“笨拙”,但这种无需 API 深度适配、直接基于 UI 交互的自动化模式,极大地拓宽了 AI 助手的应用边界。随着算法的迭代,我们正在告别“在 App 丛林中反复横跳”的时代,进入“一句话完成所有琐事”的真智能阶段。
via AI新闻资讯 (author: AI Base)