ChatGPT / AI新闻聚合

https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
✨BEST AI中转 https://api.oaibest.com 2.8折起支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN

2 小时前

不卷性能卷“人品”：xAI 发布 Grok 4.20，幻觉率创行业新低

在 AI 巨头们疯狂堆料、追逐跑分巅峰的当下，马斯克旗下的 xAI 却另辟蹊径，试图解决 AI 领域最令人头疼的“一本正经胡说八道”问题。今日，xAI 正式发布了 Grok4.20Beta。尽管在绝对智力跑分上它仍与顶级梯队保持距离，但在“诚实度”这一关键指标上，它却刷新了行业纪录。

根据 Artificial Analysis 的最新评测，Grok4.20在推理模式下的智力指数分数为48，虽然落后于和（两者均为57），但其在事实可靠性上的表现极其惊人:

● 最低幻觉率:在 AA Omniscience 测试中，Grok4.20达到了 78% 的“非幻觉率”，创下历史新高。
● 知之为知之:该模型在面对无法回答的问题时，不再倾向于编造虚假事实，而是能更准确地承认“我不知道”。这种“诚实”对于严谨的办公和研究场景至关重要。

技术架构:三位一体的 API 矩阵

为了满足不同层级的需求，xAI 此次推出了三种 API 变体:

推理模式（Reasoning）:牺牲速度换取深度逻辑思考，是此次打破幻觉记录的核心。

标准模式（Non-reasoning）:侧重于快速响应与常规交互。

多智能体模式（Multi-agent）:支持多个 AI 实例协同处理复杂任务。

市场策略:加量不加价

除了性能上的独特性，Grok4.20在商业逻辑上也极具攻击性:

● 海量上下文:支持高达 200万 token 的上下文窗口，能够一次性吞下整本书或海量代码库。
● 价格优势:其定价定在每百万 token2至6美元之间，不仅比前代 Grok4更便宜，在目前的西方主流模型中也极具竞争力。

Grok4.20的发布反映出 xAI 战略的转变——不再执着于在通往 AGI 的总分跑道上死磕，而是精准切入“企业级可靠性”这一痛点。正如测评机构所言，如果说其他模型是在努力成为“全知全能的先知”，那么 Grok4.20则在努力成为一个“绝不撒谎的助手”。

对于那些对数据准确性有极高要求的用户来说，Grok4.20或将成为除 OpenAI 和谷歌之外的第三个重量级选项。

via AI新闻资讯 (author: AI Base)

3 小时前

DeepSeek、豆包全支持！这款“网页总结神器”登陆 Edge 商店：本地大模型也能一键白嫖？

在信息爆炸的今天，面对动辄万字的深度长文，你是否也渴望有一个随叫随到的“私人秘书”?近日，一款名为 AI 页面总结器 的浏览器扩展正式上线微软 Edge 商店。它的出现，标志着网页阅读正式进入了“本地大模型”时代。

这款扩展最硬核的地方在于其极其强悍的兼容性。它不仅支持 DeepSeek、豆包、Gitee AI 等主流在线模型，更通过对接 Ollama 和 Docker Desktop AI，实现了对本地大模型的完美支持。这意味着，即便在没有网络或者对隐私极度敏感的场景下，你依然可以调用本地算力，一键生成网页精简摘要。

在功能设计上，AI 页面总结器 采用了侧边栏对话框的形式。这不仅仅是一个简单的“总结工具”，更是一个支持多轮追问的 AI 助手。你可以针对总结内容进行深度挖掘，或者让它基于当前页面上下文进行翻译和理解。为了解决大模型普遍存在的“断句”痛点，它还贴心地支持了长文本自动截断（最高15000字符）以及全 Markdown 渲染。

对于开发者和极客用户来说，这款工具的“保姆级”自动化更是加分项。比如在使用 Ollama 时，系统能自动拉取并动态切换模型，真正做到了“免配置、开箱即用”。

目前，该插件已经在 微软 Edge 商店 开放获取。在这个“算力下乡”的时代，能把顶尖大模型装进浏览器侧边栏，或许就是我们对抗信息焦虑的最好武器。

via AI新闻资讯 (author: AI Base)

3 小时前

全球首个!中国侵入式脑机接口医疗器械获批上市，开启临床应用新元年

近日，全球脑机接口领域迎来里程碑式突破。国家药监局正式批准了博睿康医疗科技（上海）有限公司研发的“植入式脑机接口手部运动功能代偿系统”创新产品注册申请。这不仅实现了该类医疗器械的全球首发上市，更标志着国际首个侵入式脑机接口医疗器械正式跨入临床应用阶段。

核心技术与系统构成

该系统采用硬脑膜外微创植入与无线供能通信技术，平衡了信号质量与手术安全性。全套产品由八大核心组分构成:

● 硬件端: 脑机接口植入体、植入式脑电电极套件、脑电信号收发器、气动手套设备。
● 软件与配套: 脑电解码软件、医用测试软件、临床管理软件，以及专用的一次性手术工具包。

适用人群与临床表现

该产品精准针对颈段脊髓损伤导致的四肢瘫患者。通过采集大脑运动意图并驱动气动手套，辅助患者实现手部抓握功能的代偿。申请使用的患者需满足以下严苛条件:

1. 年龄与病史:18至60岁，确诊超过1年且病情稳定至少6个月。
2. 损伤程度: C2～C6颈段脊髓损伤，评级为A～C级的四肢瘫。
3. 身体指征: 手部完全无法抓握，但上臂尚存部分功能。

临床试验结果证实，受试者在植入该系统后，手部抓握能力显著提升，极大地改善了日常生活自理能力。这一“从0到1”的突破，填补了国际临床空白，预示着脑机接口技术正式从实验室走向诊疗室。

via AI新闻资讯 (author: AI Base)

3 小时前

Meta 拟推迟发布 AI 模型 Avocado，因为性能竞争落后于对手模型

Meta 据称已将其代号为“Avocado”的新型人工智能模型发布时间从原定的 3 月推迟至 5 月后。据透露，在 Meta 投入上百亿资金并研发了数个月后，该模型性能仍介于谷歌 Gemini 2.5 与 Gemini 3 之间，落后于竞争对手。

Meta 今年计划继续投入 1150 亿至 1350 亿美元用于 AI 研发。Meta 发言人对此模型进展称: 推出的新模型将会展示其快速发展的轨迹，公司上下对此充满了信心。

Reuters

🍀在花频道 🍵茶馆聊天 📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel

3 小时前

🔁 #Update #GitHubCopilot

Forwarded From Agent Copilot

#Update #GitHubCopilot

GitHub Copilot Student Plan 的高级模型（如GPT-5.4、Claude Opus）将不再可用。

via AI Copilot - Telegram Channel

Update GitHubCopilot

4 小时前

中国首款6nm真自研GPU正式发售：12GB显存性能对标RTX 4060

via cnBeta.COM - 中文业界资讯站 (author: 稿源：快科技)

Telegraph

中国首款6nm真自研GPU正式发售：12GB显存性能对标RTX 4060

昨日在AWE2026大展上，砺算科技正式开启自研TrueGPU天图架构“渲推一体GPU”产品——Lisuan eXtreme系列显卡公开发售。早在去年5月，砺算科技就宣布，在经历了长达多年艰苦研发后，首颗自研架构全自主知识产权GPU芯片在封装回片后已成功点亮。同年7月26日，砺算首款GPU芯片“7G100”系列和首款显卡产品Lisuan eXtreme系列大家见面。此次砺算科技发售的消费级显卡名为Lisuan Extreme LX 7G106，配备了12GB GDDR6显存、192个纹理单元和96个…

4 小时前

20年老牌游戏媒体落幕因AI洗稿被谷歌“抹去”存在

此前，有报道称VideoGamer这家媒体使用一篇完全由AI生成的文章评测《生化危机：安魂曲》被知名网站Metacritic删除。此事近期逐渐发酵，导致该媒体被谷歌封禁无法搜索到。

VideoGamer是一家存在了20年的老牌游戏媒体，该媒体由两位大学好友于2004年共同建立。直到最近，VideoGamer这个品牌还依靠一系列原创访谈和出色的报道维持着声誉。但这家媒体被与加密货币有关的马耳他公司收购后，情况急转直下。许多为VideoGamer近期崛起做出贡献的编辑纷纷离职。不久之后，其余员工也被解雇，网站大胆转向，完全致力于发布由人工智能生成的文章和虚构的编辑。

而该媒体生成的新闻编剧资料中包含了由ChatGPT生成的照片和虚假的社交媒体档案，这是一种故意试误导谷歌的行为，因为该搜索引擎会优先推送由真实领域专家撰写的文章。因此谷歌将该媒体的搜索优先级调低，甚至完全从其索引中移除，如今该网站不再出现在搜索结果中。这对于一个运行长达20年的品牌来说是一个令人悲哀的结局。

VideoGamer联合创始人，现担任欧洲头部游戏媒体Eurogamer总编的汤姆·奥里写道："我记得创建VideoGamer（当时名为Pro-G）时，坐在布莱顿大学宿舍的一个小房间里。在很长一段时间里，它曾是我的全部生活。我希望人们记住的是它曾经对大家意味着什么，而不是它如今沦落成的这副不堪模样。"

via cnBeta.COM - 中文业界资讯站 (author: 稿源：3DMGame)

5 小时前

AI新锐被列为“供应链风险” 五角大楼正分裂美国科技企业？

via cnBeta.COM - 中文业界资讯站 (author: 稿源：环球科技)

Telegraph

AI新锐被列为“供应链风险” 五角大楼正分裂美国科技企业？

美国五角大楼将人工智能（AI）新锐Anthropic列为“供应链风险”后，美国硅谷的科技巨头们基于各自的利益考量，立场开始分化。其中，微软选择公开支持Anthropic起诉五角大楼，而Google则在Anthropic与五角大楼龃龉之际，趁势扩大了对后者的渗透。英国《金融时报》11日报道称，当地时间周二，微软公开声援Anthropic，成为首家在Anthropic与美国国防部争端中站队的科技巨头。微软在向法院提交的文件中警告称，针对这家人工智能初创企业“极端”且“史无前例”的行动将对美国科技行业产生“…

5 小时前

AI智能体博弈：美国巨头遇冷中国“龙虾热”构建新壁垒

via cnBeta.COM - 中文业界资讯站 (author: 稿源：凤凰网科技)

Telegraph

AI智能体博弈：美国巨头遇冷中国“龙虾热”构建新壁垒

3月13日，彭博社周五发文，关注了中国目前正在上演的“养龙虾”热潮，也就是安装AI智能体OpenClaw。文章称，这波热潮让中国成为了AI智能体的最大试验场，可能会让中国占据领先地位。相比之下，美国公司的智能体在吸引用户方面举步维艰。百度工程师为用户安装OpenClaw 强制AI 辛迪·翁(Cindy Weng)是一家中国大型金融集团的驻深圳产品经理。在春节放假前对工作进行收尾时，她和同事们接到通知，需要留下来参加一场安排在春节假期里的比赛。她的公司刚刚部署了OpenClaw，领导要求员工通过比赛来证…

5 小时前

Google为旗下软件推出AI问答功能地图应用进入对话时代

via cnBeta.COM - 中文业界资讯站 (author: 稿源：财联社)

Telegraph

Google为旗下软件推出AI问答功能地图应用进入对话时代

Alphabet正对其地图产品进行十多年来的最大一次升级，公司在Google地图（Google Maps）中推了名为“Ask Maps”的新功能，用户可以像与聊天机器人对话一样与应用互动。周四（3月12日），Google地图副总裁兼总经理Miriam Daniel在官方博客发文称，“我们将全球最新的地图与我们性能最强大的Gemini模型相结合，让探索地图的过程变得轻松便捷，并通过十多年来规模最大的导航升级，使体验前所未有的直观。” Daniel表示，全新的“Ask Maps”（询问地图）功能可以解答地…

5 小时前

未雨绸缪：Anthropic 成立官方智库，应对 AGI 时代的社会冲击

随着人工智能进化速度远超行业预期，AI 安全领域的先驱于美国当地时间 11 日正式宣布成立 Anthropic Institute 智库。这一组织的使命并非研发更强大的模型，而是专门研究并应对“强大 AI”可能给人类社会带来的深层挑战与严峻风险。

预测，未来两年内人工智能将迎来突破性进展，甚至可能比大多数人想象中更早触及通用人工智能（AGI）的边缘。为此，新成立的智库将重点聚焦以下四大关键领域：

● 就业与经济变革：研究 AI 自动化对全球劳动力市场的重塑及应对机制。
● 威胁与防御韧性：防范 AI 技术被滥用于生物安全、网络攻击等高危领域，增强社会防御能力。
● AI 价值观对齐：如何确保前沿 AI 系统的决策符合人类的伦理标准与社会公共利益。
● 自循环治理体系：探索 AI 在自我监督与自演化过程中的透明度与合规管理。

的目标是打破技术巨头内部的封闭性。它将作为桥梁，向公众和决策机构分享在构建前沿系统过程中遇到的真实技术挑战，并与外部科研机构、政策制定者及民间社会组织深度合作，共同制定应对方案。

近期的商业表现极为抢眼，有消息称其，旗下模型日增用户超百万。然而，在算力与财富激增的背后，始终维持其“安全优先”的企业底色。

via AI新闻资讯 (author: AI Base)

5 小时前

Meta据悉将新款AI模型的发布时间至少推迟至5月份

据知情人士称，美国科技巨头Meta已将其代号为“Avocado”的人工智能模型的发布时间从本月推迟到至少5月份。

尽管该公司正大力投资以拓展其人工智能领域的雄心壮志，包括制定自主芯片研发路线图，但其人工智能项目的时间表仍然有所延迟。今年1月，Meta公布了其年度资本支出计划，目标是实现“超级智能”——即人工智能超越人类智能的愿景。

消息人士称，Meta耗时数月研发的这款新模型与竞争对手的最新产品相比，性能表现欠佳。

消息人士还称，Meta人工智能部门的领导层已讨论过暂时获得谷歌Gemini的授权，以支持公司人工智能产品的可能性，但尚未做出任何决定。

去年12月有报道称，Meta正在开发一款代号为Avocado的文本 AI 模型，计划于第一季度发布。

via cnBeta.COM - 中文业界资讯站 (author: 稿源：环球市场播报)

5 小时前

马斯克回应xAI高层变动：正从基础开始重新构建

马斯克的人工智能初创公司xAI最近经历了一系列高层人事变动，在戴子航和张国栋离职后，xAI的11名创始成员中只剩下两人仍在公司任职，分别是Manuel Kroiss和Ross Nordeen。

当地时间周四，有报道称xAI从Cursor挖来两名高管，分别是Jason Ginsberg和Andrew Milich。

马斯克在社交平台X上回应网友对这一事件的评论时称：“xAI最初构建时并不完善，因此正从基础开始进行重新构建。特斯拉也经历了同样的情况。”

相关文章:

马斯克旗下xAI面临联合创始人离职潮 11名创始人仅剩2人在岗

via cnBeta.COM - 中文业界资讯站 (author: 稿源：环球市场播报)

5 小时前

🖼 #AI编程

#AI编程

CursorBench：基于真实对话的编程 Agent 基准测试

Cursor 认为目前公开的编程 Agent 基准测试已经存在明显局限性：如饱和严重、数据污染、与真实体验脱节等

所以 Cursor 自己做了一套基准测试，数据基于 Cursor 工程团队真实使用会话，所以更贴近实际，而非像小米一样的 PPT 数据

⭐ GPT 5.4 遥遥领先！

📮投稿 📢频道 💬群聊 🔎索引

via 极客分享 - Telegram Channel

AI编程

5 小时前

3 年狂卖 20 亿！京东联手海尔在AWE现场“搞事情”：AI厨房真的要接管你的胃了

在 AWE 2026 的火爆现场，家电巨头与电商平台的一次握手，揭开了未来三年厨房进化的序幕。 3 月 12 日下午，海尔小家电与京东厨小在上海新国际博览中心正式签署战略合作协议。双方立下了一个惊人的“军令状”：要在未来三年内，在京东全渠道实现 20 亿元 的销售总额。

这不仅仅是一次简单的卖货协议，更是一场关于“大平台×大品牌×大AI”的深度化学反应。过去，智能厨房可能只是能连网的电饭煲；而现在，海尔计划依托其深厚的 AI 布局，结合京东的海量消费大数据和全渠道渗透力，把厨房从一个“做饭的地方”变成一个“懂你的生态”。

这套 AI 厨房解决方案的核心逻辑非常清晰：通过大模型感知用户的饮食需求，重构烹饪场景。简单来说，AI 不再只是冷冰冰的指令，而是能根据你的口味、身体状态甚至食材储备，主动为你提供个性化的饮食建议。

随着京东与海尔这对“黄金搭档”的深度捆绑，AI 厨房赛道的竞争正式进入了深水区。20 亿的销售目标背后，是两家大厂对 AI 改变生活方式的坚定信心。当 AI 真正接管了柴米油盐，那个“饭来张口”的科幻未来，似乎已经近在咫尺了。

via AI新闻资讯 (author: AI Base)

6 小时前

百度健康内测AI医生助手“DoctorClaw”，短期侧重学术检索与办公辅助

据报道，百度健康近日正式启动面向医生的专业AI智能助手内测，该产品内部代号为“DoctorClaw”（龙虾医生版），标志着百度在医疗垂直领域大模型的应用落地进入关键阶段。

据知情人士透露，该项目目前处于封闭开发后的内测期，尽管具体产品形态尚未完全公开，但已临近上线。在功能设定上，DoctorClaw短期内将聚焦于学术文献检索与日常办公辅助，而其长期战略目标则是深度渗透临床诊疗、医学科研及教学管理等全场景需求，打造安全可控的数字化医疗专家助手。

此次内测正值“龙虾”概念在AI圈迅速走红之际，近期市场上涌现出包括OpenClaw及各类“养虾”助手在内的多元AI应用，引发了从算力消耗到行业标准的热议。在此背景下，百度健康切入医生侧专业赛道，不仅是对现有医疗数字化工具的补充，更是试图通过专业级AI能力解决临床效率瓶颈。

在当前医疗大模型从“通用”向“专精”转型的趋势下，DoctorClaw的内测预示着行业竞争正由C端问诊向专业壁垒更高的B端执业辅助偏移。若该产品能成功克服医疗数据的安全性与决策的精准性挑战，将有望重塑数字化医疗的工作流。

via AI新闻资讯 (author: AI Base)

6 小时前

AI 助手进化终局：Gemini 任务自动化上线，手机开始“替你办事”

谷歌承诺已久的 AI 愿景正随着的发布正式照进现实。今日，联合宣布，基于 Gemini 的“任务自动化”功能已进入 Beta 测试阶段。这一功能标志着 AI 助手从单纯的“信息查询员”转型为具备跨应用执行能力的“数字代办”，能够模拟人类操作完成订餐、打车等复杂流程。

视觉震撼:看着手机“自己用自己”

与传统的 API 对接不同，的自动化功能是在一个虚拟窗口中模拟真实的用户操作:

● 智能打车:当你给出“打车去机场”的指令，会自动唤起 Uber，确认具体的航站楼（如遇多航站楼会主动询问），并自动填入目的地。
● 代订餐食:在处理“帮我点一杯咖啡和牛角包”的指令时，AI 会自主划动屏幕寻找星巴克菜单中的特定单品（如 Flat White），甚至能像人类一样处理复杂的滚动选择。

安全逻辑:关键节点，人类掌舵

为了规避自主权带来的风险，谷歌在自动化流程中设置了严密的人工复核机制:

显式操作:用户可以实时观看的每一步动作，并随时通过“Take control”接管或终止自动化进程。

最后确认制:在最终提交订单或付款前，系统会强制停在支付界面，等待用户核实明细并手动点击“确认”，确保每一笔交易都在受控状态下完成

目前，该功能已优先适配外卖配送与网约车类应用。对于及后续用户而言，手机不再仅仅是运行 App 的载体，而是一个能够理解自然语言意图并将其转化为具体操作的“超级代理”。

尽管 AI 在菜单滚动和选项识别上偶尔还显得有些“笨拙”，但这种无需 API 深度适配、直接基于 UI 交互的自动化模式，极大地拓宽了 AI 助手的应用边界。随着算法的迭代，我们正在告别“在 App 丛林中反复横跳”的时代，进入“一句话完成所有琐事”的真智能阶段。

via AI新闻资讯 (author: AI Base)

7 小时前

xAI发布Grok4.20:推理性能提升显著，不幻觉率78%创行业纪录

2026年3月12日，xAI正式发布新一代大语言模型Grok4.20Beta，该模型在保持价格竞争力的同时，凭借极高的事实可靠性刷新了行业纪录。

根据Artificial Analysis的最新评估，Grok4.20在启用推理功能的智能指数（Intelligence Index）中获得48分，较前代版本提升6分。尽管在综合基准测试中仍与Gemini3.1Pro Preview和GPT-5.4（均为57分）存在差距，但其在AA全知测试中的表现极为出色，非幻觉率高达78%，有效解决了AI模型普遍存在的虚假信息编造问题。

在产品矩阵与工程参数方面，xAI同步推出了带推理功能、不带推理功能以及多智能体模式的三种API版本。该模型支持高达200万个令牌的上下文窗口，其定价策略极具市场渗透力，每百万令牌成本仅为2美元至6美元，较Grok4显著降低。技术层面，Grok4.20在面对未知领域时表现出极强的克制力，承认“不知道”的频率大幅提升，错误率仅约为五分之一。

当前全球大模型竞争已从单纯的参数规模转向推理深度与事实准确性的双重博弈。Grok4.20的推出，标志着xAI在追求通用人工智能（AGI）的过程中，正试图通过强化“诚实性”与“低幻觉率”来构建差异化优势。这种对事实可靠性的极致追求，不仅提升了AI在严谨行业应用中的落地潜力，也为未来多智能体协同协作提供了更为稳固的信息信任基础。

via AI新闻资讯 (author: AI Base)

Before

After

Home