https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持OpenAI, Claude, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
Estimating worst case frontier risks of open weight LLMs

摘要

本文研究了发布gpt-oss模型时的最坏情况前沿风险。我们引入了恶意微调(MFT)方法,旨在通过微调gpt-oss,使其在生物学和网络安全两个领域的能力达到最大化。为了最大化生物风险(biorisk),我们策划了与威胁制造相关的任务,并在具备网页浏览功能的强化学习环境中训练gpt-oss。为了最大化网络安全风险,我们在一个具备代理编码能力的环境中训练gpt-oss,以解决夺旗赛(CTF)挑战。我们将这些经过恶意微调的模型与开放权重和封闭权重的大型语言模型(LLM)在前沿风险评估中进行了比较。与封闭权重的前沿模型相比,经过恶意微调的gpt-oss表现不及OpenAI的o3模型,后者在生物风险和网络安全方面的能力低于“高准备度”水平。与开放权重模型相比,gpt-oss可能略微提升了生物学能力,但并未显著推动前沿发展。综合来看,这些结果促成了我们发布该模型的决定,我们希望恶意微调方法能为评估未来开放权重模型发布可能带来的危害提供有益指导。

----------------------

Abstract

In this paper, we study the worst-case frontier risks of releasing gpt-oss. We introduce malicious fine-tuning (MFT), where we attempt to elicit maximum capabilities by fine-tuning gpt-oss to be as capable as possible in two domains: biology and cybersecurity. To maximize biological risk (biorisk), we curate tasks related to threat creation and train gpt-oss in an RL environment with web browsing. To maximize cybersecurity risk, we train gpt-oss in an agentic coding environment to solve capture-the-flag (CTF) challenges. We compare these MFT models against open- and closed-weight LLMs on frontier risk evaluations. Compared to frontier closed-weight models, MFT gpt-oss underperforms OpenAI o3, a model that is below Preparedness High capability level for biorisk and cybersecurity. Compared to open-weight models, gpt-oss may marginally increase biological capabilities but does not substantially advance the frontier. Taken together, these results contributed to our decision to release the model, and we hope that our MFT approach can serve as useful guidance for estimating harm from future open-weight releases.

via OpenAI News
gpt-oss-120b & gpt-oss-20b Model Card

介绍

我们推出了 gpt-oss-120b 和 gpt-oss-20b 两款开放权重推理模型,这些模型在 Apache 2.0 许可证和我们的 gpt-oss 使用政策下提供。它们是在开源社区反馈的基础上开发的,仅支持文本输入,兼容我们的 Responses API,设计用于具备强指令遵循能力的代理工作流,支持工具使用(如网页搜索和 Python 代码执行)及推理能力——包括能够根据任务复杂度调整推理力度。模型可定制,支持完整的链式思维(CoT)和结构化输出。

安全性是我们开放模型方法的基础。这些模型与专有模型存在不同的风险特征:一旦发布,决心坚定的攻击者可能会对其进行微调,以绕过安全拒绝机制或直接优化有害行为,而 OpenAI 无法实施额外的缓解措施或撤销访问权限。

在某些情况下,开发者和企业需要实施额外的安全保障措施,以复制通过我们的 API 和产品提供的模型所内置的系统级保护。我们将此文档称为模型卡,而非系统卡,因为 gpt-oss 模型将作为各种系统的一部分被广泛使用,这些系统由不同的利益相关者创建和维护。虽然模型默认设计遵循 OpenAI 的安全政策,但其他利益相关者也会做出并实施自己的决策,以确保这些系统的安全。

我们对 gpt-oss-120b 进行了可扩展能力评估,确认该默认模型在我们准备框架的三个跟踪类别(生物与化学能力、网络能力和 AI 自我改进)中均未达到高能力的指示阈值。我们还调查了两个额外问题:

对抗性行为者是否能通过微调 gpt-oss-120b,使其在生物与化学或网络领域达到高能力?模拟攻击者的潜在行为,我们对 gpt-oss-120b 进行了针对这两个类别的对抗性微调。OpenAI 安全咨询组(SAG)审查了该测试,结论是即使利用 OpenAI 领先的训练技术进行强力微调,gpt-oss-120b 仍未达到生物与化学风险或网络风险的高能力水平。
发布 gpt-oss-120b 是否会显著推动开放基础模型在生物能力领域的前沿?我们的发现是否定的:在大多数评估中,一个或多个现有开源模型的默认表现已接近 gpt-oss-120b 对抗性微调后的表现。

作为此次发布的一部分,OpenAI 重申其致力于推动有益 AI 发展并提升整个生态系统安全标准的承诺。

----------------------

Introduction

We introduce gpt-oss-120b and gpt-oss-20b, two open-weight reasoning models available under the Apache 2.0 license and our gpt-oss usage policy. Developed with feedback from the open-source community, these text-only models are compatible with our Responses API and are designed to be used within agentic workflows with strong instruction following, tool use like web search and Python code execution, and reasoning capabilities—including the ability to adjust the reasoning effort for tasks that don’t require complex reasoning. The models are customizable, provide full chain-of-thought (CoT), and support Structured Outputs.

Safety is foundational to our approach to open models. They present a different risk profile than proprietary models: Once they are released, determined attackers could fine-tune them to bypass safety refusals or directly optimize for harm without the possibility for OpenAI to implement additional mitigations or to revoke access.

In some contexts, developers and enterprises will need to implement extra safeguards in order to replicate the system-level protections built into models served through our API and products. We’re terming this document a model card, rather than a system card, because the gpt-oss models will be used as part of a wide range of systems, created and maintained by a wide range of stakeholders. While the models are designed to follow OpenAI’s safety policies by default, other stakeholders will also make and implement their own decisions about how to keep those systems safe.

We ran scalable capability evaluations on gpt-oss-120b, and confirmed that the default model does not reach our indicative thresholds for High capability in any of the three Tracked Categories of our Preparedness Framework (Biological and Chemical capability, Cyber capability, and AI Self-Improvement). We also investigated two additional questions:

Could adversarial actors fine-tune gpt-oss-120b to reach High capability in the Biological and Chemical or Cyber domains? Simulating the potential actions of an attacker, we adversarially fine-tuned the gpt-oss-120b model for these two categories. OpenAI’s Safety Advisory Group (“SAG”) reviewed this testing and concluded that, even with robust fine-tuning that leveraged OpenAI’s field-leading training stack, gpt-oss-120b did not reach High capability in Biological and Chemical Risk or Cyber risk.
Would releasing gpt-oss-120b significantly advance the frontier of biological capabilities in open foundation models? We found that the answer is no: For most of the evaluations, the default performance of one or more existing open models comes near to matching the adversarially fine-tuned performance of gpt-oss-120b.

As part of this launch, OpenAI is reaffirming its commitment to advancing beneficial AI and raising safety standards across the ecosystem.

via OpenAI News
#Announcement #OpenAI

OpenAI 现已开源两款模型:

- gpt-oss-120b
- gpt-oss-20b

120b 宣称性能略弱于 o4-mini。

https://openai.com/open-models/

via AI Copilot - Telegram Channel
OpenAI 的开源模型发布
Openai
Open models by OpenAI

Advanced open-weight reasoning models to customize for any use case and run anywhere.


via LoopDNS资讯播报 - Telegram Channel
Jetbrians AI 现在对 OpenAi 与 Anthropic 的模型支持了图像识别

同时所有受支持语言的补全都更加智能,现在具有对 SQL、YAML、JSON、Markdown 等语言的支持

via LoopDNS资讯播报 - Telegram Channel
#Update #Claude

Claude Opus 4.1 现已发布,小幅改进了编程、研究和数据分析能力。

现已通过 API 和 Claude App 提供(需要订阅)。

via AI Copilot - Telegram Channel
Anthropic发布功能更加强大的AI模型Opus 4.1

抢在ChatGPT-5之前,Anthropic发布功能更加强大的AI模型Opus 4.1,编程、研究、数据分析能力都更加强大。(格隆汇)

via LoopDNS资讯播报 - Telegram Channel
BugBot Service Degradation due to GitHub Outage

Aug 5, 15:45 UTC
Monitoring - Due to a GitHub service outage, some BugBot functionality may be temporarily unavailable.
Once the outage is resolved, all services should resume normal operations shortly after.

https://www.githubstatus.com/

Aug 5, 15:40 UTC
Investigating - We are investigating an internal alert regarding BugBot errors.

via Cursor Status - Incident History
🤖 美国政府将OpenAI、Google和Anthropic列入联邦机构AI供应商名单

美国政府已将OpenAI、Google和Anthropic三家公司列入获准向民间联邦机构提供人工智能服务的供应商名单。这些公司将通过新的联邦承包平台“多重奖励计划”(MSA)提供AI工具,该平台允许政府机构通过预先协商的合同获取AI服务,从而避免单独谈判。负责MSA的美国总务管理局(GSA)表示,对这些科技公司的评估基于安全性和性能。此举是在特朗普总统发布一项侧重于人工智能发展的行政命令之后进行的,该命令包括调整环境标准以增加数据中心能源供应,并指示联邦机构仅使用“不受意识形态偏见”的人工智能。

(IT业界资讯)

via 茶馆 - Telegram Channel
Elevated errors on ChatGPT conversations for paid users

Status: Identified

We have identified that some paid users are experiencing elevated errors for ChatGPT conversations. We are working on implementing a mitigation.

Affected components
Conversations (Degraded performance)

via OpenAI status
美国将 OpenAI、Google和Anthropic添加到联邦机构认可的AI供应商名单中

据彭博社报道,美国政府已将Google、OpenAI 和 Anthropic 列入可向民间联邦机构提供人工智能服务的获准供应商名单。这些公司将通过新的联邦承包平台“多重奖励计划”(MSA)获得他们的人工智能工具,这将允许政府机构通过预先协商的合同来接触人工智能工具供应商,而不是与供应商单独协商。

据彭博社报道,负责 MSA 的美国总务管理局 (GSA) 表示,对科技公司的评估是基于安全性和性能的。

这一消息是在唐纳德·特朗普总统发布行政命令之后发布的,该命令侧重于人工智能发展,包括调整环境标准以增加数据中心的能源供应,以及指示联邦机构只使用“不受意识形态偏见”的人工智能。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
美国总务管理局批准OpenAI、谷歌及Anthropic加入联邦AI供应商名录

美国联邦政府采购主管部门周二将OpenAI的ChatGPT、谷歌的Gemini和Anthropic的Claude列入人工智能核准供应商名单,以加速政府部门对AI技术的应用。美国总务管理局(GSA)此举通过预先确立合同条款的采购平台,为各政府机构提供现成的AI工具。GSA强调,获批AI供应商“承诺遵循负责任使用原则并符合联邦标准”。

via LoopDNS资讯播报 - Telegram Channel
三家AI企业赢得美国政府民用AI合同批准

美国政府的中央采购部门正在将OpenAI、谷歌和Anthropic添加到获批人工智能供应商名单中,这为该项技术在民事联邦机构中的广泛采用打开了大门。美国总务管理局 (GSA) 将于周二宣布的这一举措,将通过其“多重奖励计划”提供这些工具,一个合同条款已设定的联邦合同平台,从而加快人工智能工具在联邦政府的采用。若没有这种灵活性,各机构通常将耗费数月时间协商自己使用该技术的条款。总务管理局官员表示,这三家公司的模型接受了多项性能和安全措施的评估。

—— 彭博社

via 风向旗参考快讯 - Telegram Channel
🛡️ ChatGPT新增休息提醒并加强心理健康支持

主要更新:
* 休息提醒: OpenAI已为ChatGPT添加休息提醒功能,在用户长时间对话后会提示是否需要休息,用户可选择“继续聊天”。
* 心理健康支持: ChatGPT将改进对“高风险个人决策”的响应方式,不再直接给出答案,而是通过提问和权衡利弊来引导用户思考。此举与上周为学生推出的“学习模式”类似。

背景与原因:
* OpenAI正与心理健康专家和人机交互研究人员合作,以改进ChatGPT对精神或情感困扰迹象的检测和响应,并测试新的安全措施。
* 此前,ChatGPT曾出现鼓励妄想关系、加剧心理健康问题,甚至在用户失业后建议跳楼等不当行为。OpenAI承认其4o模型在识别妄想或情感依赖方面存在不足。

OpenAI的承诺与此前事件:
* OpenAI承诺将持续改进模型,以确保ChatGPT能适当回应并引导用户寻求循证资源。
* OpenAI首席执行官Sam Altman曾警告用户,ChatGPT对话不具隐私性,必要时可能被用作法庭证据。
* 今年早些时候,OpenAI曾因ChatGPT变得过于“谄媚”而回滚了一次更新。

(PCMag.com)

via 茶馆 - Telegram Channel
xAI新图像和视频生成器可制作NSFW内容

埃隆·马斯克的人工智能公司已正式向 iOS 应用的所有SuperGrok和Premium+ X订阅用户推出Grok Imagine,即xAI的图像和视频生成器。正如马斯克一贯的风格,他将Grok定位为无过滤、突破边界的人工智能,该生成器允许用户制作不宜在工作场所浏览(NSFW)的内容。Grok Imagine承诺将文本或图像提示转化为带原生音频的15秒视频,其“spicy 模式”允许用户生成包含部分女性裸体的露骨色情内容。内容露骨程度存在限制。新闻媒体编辑提交的许多更“spicy”的提示会生成被模糊处理的图像,这些图像被 “审查” 因此无法访问。不过其成功生成了半裸体图像。

—— Techcrunch

via 风向旗参考快讯 - Telegram Channel
GitHub CEO致开发者警告:拥抱AI,否则退出

GitHub首席执行官Thomas Dohmke在题为《Developers, Reinvented》的博客中明确表示,开发者必须接受AI,否则将难以继续从事这一职业。他援引受访开发者的观点称:“要么拥抱AI,要么离开你的职业生涯。”这反映出AI正从辅助工具转变为开发工作的核心。早期对AI工具如GitHub Copilot持怀疑态度的开发者,如今已将其视为关键协作伙伴。开发者的角色正从编写代码转向设计上下文、提示工程和代码审核,成为“代码推动者”或“代码创意总监”。

Dohmke指出,AI不会削弱开发者价值,而是重新定义其核心能力。未来关键技能包括系统设计、AI协作、任务委派与质量保障。他预测,AI可能在两到五年内自动生成90%的代码。

Business Insider

🍀频道 🍵茶馆 📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel
↩️🎬 Grok Imagine内置“spicy mode”,支持生成 NSFW 内容


科技圈🎗在花频道📮:

马斯克宣布Grok Imagine 正式推出,为Grok支持的文本转视频 AI 工具。目前该功能正向 Grok 高级订阅用户开放。 X 🍀频道 🍵茶馆 📮投稿

Grok Imagine内置“spicy mode”,支持生成 NSFW 内容

埃隆·马斯克旗下 xAI 公司正式上线图像与视频生成器 Grok Imagine,现已向所有 SuperGrok 和 Premium+ 级别的 X 应用 iOS 用户开放。该工具可将文本或图片提示生成最长 15 秒的视频,并内置“spicy mode”,允许用户生成包含部分女性裸露的成人内容,但部分敏感生成结果会被模糊处理。

Grok Imagine 还可生成名人相关内容,但对敏感主题有限制,如无法生成特朗普怀孕等画面。该工具目前与 Google DeepMind、OpenAI、Runway 等竞品展开竞争,马斯克称其模型将持续优化。

TechCrunch

🍀频道 🍵茶馆 📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel
46c748da2d.mov
13.9 MB
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]