https://api.oaibest.com - API中转2.8折起
https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
OpenAI推出GPT‑5.1-Codex-Max编程模型 专为长时间运行的任务打造

OpenAI今日发布了GPT‑5.1-Codex-Max,这是一款面向长时间运行任务设计的新一代Agentic编码模型。相较于之前的模型,GPT‑5.1-Codex-Max采用了“压缩(compaction)”技术,可在多个上下文窗口间工作,甚至能在单次任务中可靠处理百万级别的Token。OpenAI表示,该模型不仅性能提升,还实现了更快、更高效的Token利用率。

据了解,GPT‑5.1-Codex-Max训练过程涵盖了真实世界的软件工程任务,如PR创建、代码评审、前端开发及问答等,并在众多前沿编程评测中表现超越此前的模型。例如,该模型在SWE-Bench Verified(样本数500)上获得77.9%的得分,在SWE-Lancer IC SWE测评中达到79.9%,在TerminalBench 2.0测评中则取得58.1%的成绩,均高于GPT-5.1-Codex此前的表现。

除支持Unix平台外,GPT‑5.1-Codex-Max还专门针对Windows环境进行了训练。在复杂重构及长时间运行的agent循环中,大多数市面上的编码模型受限于上下文窗口,难以持续工作。而GPT‑5.1-Codex-Max能够在接近窗口限制时自动压缩会话内容,从而自主运行数小时甚至数十小时。据OpenAI内部测试数据显示,该模型可持续运行超过24小时。

此外,得益于推理能力提升,GPT‑5.1-Codex-Max在SWE-Bench Verified上完成相同任务时,使用的思考Token比GPT-5.1-Codex减少了30%。通过“Extra High(xhigh)”推理模式,模型在复杂任务中可投入更深入的思考。

目前,GPT‑5.1-Codex-Max已在Codex CLI、IDE扩展、云端和代码评审等产品中上线,支持ChatGPT Plus、Pro、Business、Edu和Enterprise高级订阅用户。同时,OpenAI也将于近期将该模型引入API,并在Codex中替换为默认模型。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
人工智能教父之一LeCun将最早于本周宣布离开Meta

根据知情人士透露,在Meta Platforms Inc.领导一个研究实验室的人工智能先驱Yann LeCun计划宣布离开这家社交媒体巨头,并创办一家新公司。

知情人士透露,自2013年起就在Meta任职的LeCun最快将于本周宣布这一消息。一位了解安排的知情人士表示,Meta计划与LeCun就他的初创公司展开合作,但具体细节仍在敲定中。

据知情人士透露,LeCun创建的新公司将专注于他对联合嵌入预测架构(JEPA)世界模型的愿景。该模型基于视觉和其他感官信息进行训练,使其能够对物理世界进行预测。

Meta公司的一位发言人证实LeCun即将离职。LeCun本人未立即回应置评请求。

LeCun被誉为人工智能行业的“教父”之一。他在Meta的工作重点是长期人工智能研究,其中许多研究在数年甚至数十年后才会对消费者体验产生影响。据知情人士透露,由于Meta公司更专注于构建模型以应对OpenAI、谷歌和Anthropic PBC等竞争对手的直接威胁,LeCun在Meta的项目较难获得所需资源。

英国《金融时报》此前曾报道称LeCun计划创办一家初创公司。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
Teacher Access Terms

via OpenAI News
GPT-5.1-Codex-Max System Card

GPT‑5.1-Codex-Max 是我们最新一代具有 agentic 能力的编程代理模型。它建立在我们对基础推理模型的更新之上,该模型在软件工程、数学、科研、医学、计算机使用等多个领域的 agentic 任务上接受训练。它也是我们首个通过名为 compaction 的过程原生训练、能够在多个上下文窗口间协同工作的模型,能在单项任务中连贯处理数百万个标记。像以往型号一样, GPT‑5.1-Codex-Max 在真实世界的软件工程任务上接受训练,包括 PR 创建、代码审查、前端开发和 Q&A。

该系统说明概述了为 GPT‑5.1-Codex-Max 实施的全面安全措施。内容既包括模型层面的缓解手段——例如针对有害任务和 prompt injections 的专项安全训练——也包括产品层面的防护措施,如 agent sandboxing 和可配置的网络访问。

我们在 Preparedness Framework 下对 GPT‑5.1-Codex-Max 进行了评估。该模型在网络安全领域能力很强,但尚未达到网络安全方面的 High capability 水平。我们预计能力迅速提升的态势将持续,模型在不久的将来可能跨越这一门槛。与其他近期模型一样,它在生物学领域被视为 High capability ,并部署了与我们对 GPT‑5 使用的相应防护套件。它在 AI 自我改进方面则未达到 High capability 。

----------------------

Introduction

GPT‑5.1-Codex-Max is our new frontier agentic coding model. It is built on an update to our foundational reasoning model trained on agentic tasks across software engineering, math, research, medicine, computer use and more. It is our first model natively trained to operate across multiple context windows through a process called compaction, coherently working over millions of tokens in a single task. Like its predecessors, GPT‑5.1-Codex-Max was trained on real-world software engineering tasks like PR creation, code review, frontend coding and Q&A.

This system card outlines the comprehensive safety measures implemented for GPT‑5.1-CodexMax. It details both model-level mitigations, such as specialized safety training for harmful tasks and prompt injections, and product-level mitigations like agent sandboxing and configurable network access.

GPT‑5.1-Codex-Max was evaluated under our Preparedness Framework. It is very capable in the cybersecurity domain but does not reach High capability on cybersecurity. We expect current trends of rapidly increasing capability to continue, and for models to cross the High cybersecurity threshold in the near future. Like other recent models, it is being treated as High capability on biology, and is being deployed with the corresponding suite of safeguards we use for GPT‑5. It does not reach High capability on AI self-improvement.

via OpenAI News
Alphabet股价飙升 最新发布的Gemini人工智能模型“好评如潮”

Alphabet Inc.周三股价创下两个月来最大涨幅,其最新发布的Gemini人工智能模型获得大量好评,提振了投资者对该公司立足于瞬息万变科技领域的信心。

该股最高上涨6.9%,创下自9月初以来的最大涨幅,并刷新历史新高。截至纽约时间11点,Alphabet看涨期权成交量突破37.6万份,远超20日均值约29万份的全天交易量。标普500指数上涨约0.5%,科技股占比较高的纳斯达克100指数则上涨0.8%。

这家谷歌母公司周二发布了最新版本的Gemini人工智能模型,其性能获得一致好评。该模型的强大表现与OpenAI的GPT-5形成鲜明对比,后者今年早些时候发布时则反响褒贬不一。

Robert W. Baird & Co.分析师Colin Sebastian在致客户报告中写道,“Gemini 3是否就是GPT-5本应达到的水平?”他援引了该版本获得的“极高评价”,并指出,“除提升搜索参与度和变现能力外,谷歌还融合了实时网络索引与先进模型训练技术,我们认为这是其关键竞争优势。”

via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
欧盟希望浏览器来管理Cookie偏好设置

自2018年实施以来,欧盟的Cookie同意政策始终是欧洲网页浏览体验中恼人并且不可避免的组成部分。但由于欧盟委员会今日宣布的一些重大改革提案,这场Cookie噩梦即将瓦解。欧盟正准备强制执行一项规则,使用户能在浏览器层级设置Cookie偏好,而非必须对欧洲访问的每个网站点击弹窗中的接受或拒绝。欧盟表示:“人们可用集中设置隐私偏好,例如通过网络浏览器,网站必须予以遵循。这将极大简化用户的在线体验。”这项关键变化是旨在简化欧盟数字规则的新数字提案的一部分,最初将把Cookie提示更改为简化的 “是”或“否” 单次单击提示,随后相关技术解决方案最终将集成至浏览器。

—— Theverge

via 风向旗参考快讯 - Telegram Channel
美国前财长萨默斯从OpenAI董事会辞职

前财政部长劳伦斯·萨默斯周三说,在他与恶名远扬的性犯罪者杰弗里·爱泼斯坦之间的邮件公开后,他将从OpenAI董事会辞职。萨默斯周一曾宣布将退出所有公开职务,但当时尚不清楚这是否包括他在该人工智能初创公司的职位。萨默斯在声明中说:“我感激曾获得服务的机会,对公司的潜力感到兴奋,并期待关注其进展。”OpenAI董事会表示尊重萨默斯的辞职决定。“我们感谢他的诸多贡献以及他为董事会带来的独到见解,” OpenAI 董事会在声明中表示。萨默斯与爱泼斯坦的通信细节于上周被公开,此前众议院监督和政府改革委员会公布了根据对爱泼斯坦遗产的传票获得的两万多份文件。

—— CNBC

via 风向旗参考快讯 - Telegram Channel
沃伦参议员就潜在AI救助计划向政府施压

民主党参议员伊丽莎白·沃伦正向特朗普政府施压,要求提供有关可能用纳税人的资金“支撑”主要AI公司的计划的更多信息。在致白宫AI与加密货币特别顾问萨克斯和白宫科技政策办公室主任克拉修斯的信中,沃伦参议员写道,特朗普总统与AI企业高管及捐助者的 “密切关系” 引发担忧,即政府将救助AI企业高管和股东,而让纳税人为此买单。沃伦指出近期 OpenAI 首席财务官莎拉·弗里亚的一次访谈,其中暗示政府可能为公司的AI投资担保,随后又收回了这一说法。然而沃伦指出,OpenAI曾在十月致函克拉修斯,请求特朗普政府将政府资助的“先进制造业投资税收抵免”扩展至支持AI服务器生产和数据中心。

—— Theverge

via 风向旗参考快讯 - Telegram Channel
上线仅两天 阿里千问App冲入苹果App Store总榜前三

今日,千问App在公测上线仅两天后,已成功冲入苹果App Store免费应用总榜第三位。据悉,阿里巴巴17日推出AI应用千问App后,热度持续飙升,昨日排名已超越DeepSeek。在上线首日,其火爆人气一度导致服务器拥堵,“阿里巴巴千问崩了”话题登上微博热搜。

官方则以“我好着呢,状态良好,欢迎来问”幽默回应。

此次发布也标志着阿里正全力进军AI to C市场。

阿里巴巴将其视为“AI时代的未来之战”。

据介绍,千问App主打免费,并计划与阿里生态内的各类生活场景深度结合,其目标是与ChatGPT展开全面竞争。

而面向海外市场的千问App国际版也将在近期上线。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)
Google 发布 Gemini 3

2025-11-19 18:30 by 破译滑铁卢

Google 发布了其最先进的 Gemini 3 模型,模型的 LMArena Leaderboard 得分达到了 1501 Elo,在多项基准测试中表现出色,其中 GPQA Diamond 博士级推理能力测试得分 91.9%,不使用任何工具的情况下在 Humanity's Last Exam 测试中得分 37.5%。Gemini 3 即日起可在 Gemini 应用、AI Mode in Search for Google AI Pro、Google AI Studio、Vertex AI 和 Google Antigravity 中使用。第三方平台如 Cursor、GitHub、JetBrains、Manus 和 Replit 也可访问该模型。Google 还表示,AI Overviews 月活用户已达 20 亿,Gemini 应用月活用户逾 6.5 亿。

https://blog.google/products/gemini/gemini-3/#gemini-3

#Google

via Solidot - Telegram Channel
Google将新加坡设立AI研究实验室 并为学生提供免费AI Pro计划

Google DeepMind正在新加坡设立新的基地,旨在推动人工智能(AI)在亚太地区的研发及其在现实世界中的应用。这家人工智能研究实验室表示,此举建立在其在该地区现有工作的基础上,并且在过去一年中,其亚太团队规模几乎翻了一番。

一支由研究科学家、软件工程师和人工智能影响专家组成的团队将在新加坡基地开展关键领域的研究和开发工作,继续DeepMind在亚太地区语言和文化包容性方面的基础研究,提升Gemini的核心能力,并将最新模型应用于Google产品和云客户。

对于不太了解的人来说,Google DeepMind是Gemini、Veo、Imagen、Gemma和Lyria等热门人工智能模型的幕后推手。这家Alphabet旗下子公司总部位于伦敦,已在美国、加拿大、法国、德国和瑞士设有多个研究实验室。

该人工智能研究实验室将直接与该地区的政府机构、企业和学术机构开展合作。 DeepMind 的 AlphaFold 人工智能程序能够预测蛋白质结构,新加坡的一个研究团队利用该程序在帕金森病的研究方面取得了突破性进展,并找到了实现早期诊断和靶向治疗的方法。

DeepMind 已与新加坡政府科技局 (GovTech Singapore) 和其他机构合作,在Google的物理隔离云基础设施上测试了先进的智能体人工智能系统,使新加坡政府成为亚洲首个进行此类测试的机构。

与此同时,其姊妹公司Google正在为新加坡的大学生提供为期一年的免费 Google AI Pro 服务,使他们能够使用最新的 Gemini 3 Pro 和 Veo 3.1 模型,无限上传图像进行分析,以及 2TB 的存储空间等诸多权益。

Google在细则中指出,符合条件的学生可以在 12 月 9 日之前注册免费使用。这家搜索巨头在印度也采取了类似的举措,为学生提供一年半的免费 Google AI Pro 服务。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]