https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
叫板英伟达?OpenAI联手芯片黑马Cerebras,开启低延迟推理新纪元

面对日益增长的实时计算需求,人工智能巨头 OpenAI 正在大幅扩张其硬件版图。本周三,OpenAI 正式宣布与芯片制造商 Cerebras 达成一项为期多年的深度合作协议,旨在通过专用芯片技术突破现有 AI 响应速度的瓶颈。

百亿规模的计算资源布局

据知情人士及路透社透露,这笔交易的总价值超过 100亿美元。根据协议,从今年起至2028年,Cerebras 将向 OpenAI 提供高达 750兆瓦 的计算能力。

Cerebras 成立于十余年前,凭借专为 AI 设计的非 GPU 架构系统,在后 ChatGPT 时代的 AI 热潮中脱颖而出。其核心优势在于性能表现:Cerebras 声称其系统在处理 AI 应用时,速度显著优于以英伟达(Nvidia)为代表的传统 GPU 方案。

核心目标:实现“实时推理”

此次合作的核心在于提升用户体验的连贯性。OpenAI 表示,这些系统将大幅缩短原本耗时较长的响应过程。OpenAI 负责人 Sachin Katti 指出,公司的策略是构建“弹性系统组合”,而 Cerebras 将作为专用低延迟推理解决方案,为用户提供更自然、更快速的交互基础。

Cerebras 首席执行官 Andrew Feldman 对此形象地评价道:“正如宽带改变了互联网,实时推理也将改变人工智能。”

深厚的资本纽带与扩张雄心

此次重磅合作并非偶然。OpenAI 首席执行官 Sam Altman 此前已是 Cerebras 的投资者,且 OpenAI 曾一度考虑收购该公司。

目前,Cerebras 虽多次推迟其2024年的 IPO 计划,但在一级市场表现强劲。周二有消息称,该公司正洽谈以 220亿美元 的估值进行10亿美元的新一轮融资。此次与 OpenAI 的百亿签约,无疑为其在全球 AI 算力竞赛中增添了极重的筹码。

via AI新闻资讯 (author: AI Base)
谷歌 Gemini 升级“个人智能”:跨应用深度整合,化身私人管家

谷歌旗下的 AI 聊天机器人Gemini近日迎来重大能力升级,正式推出名为“个人智能”(Personal Intelligence)的核心功能。这一更新标志着 Gemini 从单纯的对话工具,进化为能够深度理解用户个人生活习惯的数字助理。

通过该功能,用户可以将自己的 Gmail 邮件、Google Photos相册、搜索记录以及YouTube观看历史等数据与 Gemini 无缝连接。与以往简单的信息抓取不同,新版本在最新的 Gemini3系列大模型支持下,具备了跨应用、跨数据源的综合推理能力。这意味着,用户无需明确指定资料来源,Gemini 就能自动串联各方信息并给出精准建议。

在官方展示的场景中,当用户询问爱车的轮胎规格时,Gemini 不仅能给出标准参数,还能根据用户相册中全家自驾游的照片记录,推断出其经常进行长途旅行,从而额外推荐更适合全气候路况的轮胎选项。这种基于个人语境的深度洞察,让 AI 的回答更具针对性和“人情味”。

针对用户最关心的隐私问题,谷歌明确表示,“个人智能”功能完全遵循“主动加入”原则。除非用户手动选择开启,否则Gemini不会自动访问任何私人数据,确保用户在享受便捷服务的同时,拥有对个人信息的绝对掌控权。

划重点:

🔗 深度整合: Gemini现可连接 Gmail、相册、搜索和 YouTube 记录,实现多源数据综合分析,不再需要用户反复切换应用提供背景。
💡 智能推理: 依托最新的 Gemini3模型,AI 能根据用户的历史记录(如旅游照片)推断其潜在需求,并提供定制化的生活建议。
🔐 隐私可控: 谷歌强调该功能为可选项,用户必须主动开启授权,Gemini 才会读取私人信息,保障了数据使用的透明度。

via AI新闻资讯 (author: AI Base)
X平台紧急收紧Grok图像功能:全面禁止编辑真人照片,生成裸露内容遭严控

在持续数周的舆论风暴与监管压力下,X平台(原Twitter)于今日凌晨通过其官方安全账号@Safety宣布,对旗下AI模型Grok的图像生成与编辑功能实施史上最严格限制。此举直接回应了近期多起关于Grok生成涉及儿童“性化”图像及未经同意裸露内容的严重指控。

根据最新政策,Grok将彻底禁止对任何现实人物的照片进行编辑,尤其严禁将其修改为穿着比基尼、内衣等暴露服装的形象。该限制适用于所有用户,无论是否为付费订阅者。同时,X明确承诺:“Grok AI不会再将真人的照片改成‘比基尼照’。”

此外,xAI决定将图像生成功能全面纳入付费墙后,非订阅用户将完全丧失生成图片的权限。而在法律明确禁止的地区(如美国加州),系统将直接屏蔽所有生成“现实人物身穿比基尼或内衣”类图像的能力,从源头杜绝违规内容产出。

这一系列举措紧随加州总检察长罗布·邦塔(Rob Bonta)启动的正式调查。据其披露,一项独立分析显示,在2025年圣诞至新年期间,xAI生成的约2万张图像中,超半数包含极度暴露的人物形象,其中不乏疑似未成年人的内容,引发对AI平台内容安全机制的重大质疑。

面对危机,马斯克此前曾辩称,他对Grok生成未成年人裸露图像“毫不知情”,并解释称相关功能仅在开启NSFW(成人内容)选项时可用,且理论上应限于虚构的成年角色,尺度参照Apple TV上的R级电影。但他也承认,系统需根据各地法律动态调整限制策略。

X平台在声明中重申对儿童剥削行为零容忍的立场,并表示将持续清理包括儿童性虐待材料(CSAM)和未经同意裸露内容在内的高危信息。然而,此次事件再次暴露了生成式AI在开放部署中面临的伦理与合规挑战——当技术能力跑在监管与安全机制之前,再强大的模型也可能成为风险放大器。

在AI生成内容日益逼真的今天,如何平衡创造力与安全性,已成为所有大模型厂商无法回避的核心命题。

via AI新闻资讯 (author: AI Base)
深陷“比基尼照”风波,X 平台紧急收紧 Grok AI 图像编辑权限

面对持续数周的舆论压力,埃隆·马斯克旗下的 X 平台今日宣布,将正式收紧其人工智能助手Grok的图像编辑与生成功能。此前,该模型因被指控生成涉及儿童的性化图像及未经许可的裸露内容,引发了全球范围内的广泛争议。

根据 X 平台安全账号发布的最新声明,平台已通过技术手段禁止Grok对现实人物的图像进行恶意编辑,重点封堵了将他人照片修改为身着比基尼或其他暴露服装的功能。值得注意的是,这一禁令覆盖了平台的所有用户,即便是付费订阅者也将受到同样的约束。此外,为了进一步加强监管,xAI 决定将图像生成功能完全纳入付费体系,非付费用户将不再拥有相关权限。

此次功能“大缩水”的背后是来自法律层面的严峻挑战。就在声明发布前不久,加州政府已对Grok在处理儿童剥削材料方面的漏洞展开调查。调查报告显示,在刚刚过去的圣诞与新年期间,该模型生成的数万张图像中,超过一半涉及衣着暴露的内容,甚至包含疑似未成年人的形象。

尽管马斯克此前曾表示对这些违规内容“并不知情”,并强调Grok的设计初衷是仅允许生成虚构角色的受限内容,但随着多国监管机构的介入,X 平台最终选择了通过严厉的限制措施来回应外界的担忧。

划重点:

🚫 功能受限: Grok已被禁止对现实人物图像进行二次编辑,用户无法再利用该 AI 将真人照片修改为穿着比基尼等暴露服饰的形象。
💰 全面收费: 图像生成功能现已成为付费用户的专属,普通非付费用户将无法再调用Grok进行任何形式的图片创作。
⚖️ 监管压力: 因涉及大量“性化”及疑似未成年人违规图像,X 平台正面临加州等多地的法律调查,平台承诺将对儿童剥削行为采取零容忍立场。

via AI新闻资讯 (author: AI Base)
苹果发布多模态新模型 Manzano:打破“看图”与“绘图”的界限

长期以来,人工智能领域存在一个技术痛点:让模型“理解图像”和“生成图像”往往难以兼得。通常,擅长分析图片的内容(视觉理解)的模型,在从头创作高质量图片(图像生成)时表现乏力,反之亦然。然而,苹果公司最新发表的研究论文推出了一款名为“Manzano”的多模态模型,试图彻底解决这一难题。

Manzano 的核心突破在于其创新的“双修”架构。研究人员指出,传统的视觉理解偏好连续的数据流,而图像生成则依赖离散的数据块,这导致模型在同时处理两项任务时容易产生冲突。为了实现近乎无损的融合,Manzano 引入了“混合视觉分词器”。它能同时生成连续和离散的视觉表示,再通过大语言模型预测图像语义,最后由扩散解码器完成像素级的精细渲染。

在实际测试中,Manzano 展现出了惊人的逻辑理解力。即使面对“一只鸟在大象下方飞翔”这种违背常规物理常识的复杂指令,它的表现也与 GPT-4o 等顶尖模型旗鼓相当。此外,该模型不仅能画画,还能处理深度估计、风格迁移和图像修复等多种复杂任务。

虽然 Manzano 目前仍处于研究阶段,但 AIbase 认为,这项底层技术的成熟预示着苹果未来的 AI 功能将更加强大。该技术极有可能被整合进苹果的“图乐园”(Image Playground)等工具中,为用户提供更智能、更具想象力的创作体验。

项目:https://machinelearning.apple.com/research/manzano

划重点:

👁️ 全能架构: Manzano采用了创新的三段式架构,成功融合了“视觉理解”与“图像生成”功能,解决了传统模型难以兼顾两者的冲突。
🧠 逻辑领先: 在处理反直觉和复杂空间关系的指令时,Manzano 的逻辑准确性已达到行业顶尖水平,足以媲美GPT-4o等主流模型。
🚀 潜力巨大: 该模型支持从3亿到300亿参数的灵活扩展,未来有望显著提升 iPhone 和 Mac 等端侧设备的 AI 绘图与修图能力。

via AI新闻资讯 (author: AI Base)
苹果发布多模态 AI 新宠 “Manzano”:视觉与创意的完美融合

近日科技媒体 Appleinsider,苹果发表了一篇磅研究论文,介绍了最新研发的多模态 AI 模型 “zano”。这一模型将 “视觉” 和 “文本生成图像” 这两项功能有机结合,标志 AI 技术的又一次重大突破。

“Manzano” 的核心创新在于其 “双修” 能力:它不仅能够像人类一样精准地图像内容能根据文本生成高质量的图片。这技术的前无疑是令人振奋的在行业内,能同时满足两项需求的模型并多见,而现有模型往在画质理解能力之间存在妥协。

为了克服这一难题,Manzano 采用了的三段式架构。首先引入了一种 “混合器”,能同时生成连续和离散的视觉表示接着,强大的大语言模型(LLM)对像的义内容进行预测,通过 “扩散解码器” 进行像素级一设计使得 Manzano 在和图方面都表现出,甚至能够处理一些复杂任务,比如深估计、风格移和图像修复。

数据显示,Manzano 在对反直觉和违物理常识的复杂指令时,表现非常出色。例如,当生成 “一只鸟在大下方飞翔” 的画面时,Manzano 的逻辑准确性与 OpenAI 的 GPT4o 和谷歌 Nano Banana 模型不相上下。研究团队还测试了不同参数版本的模型,结果表明,随着模型规模的扩大,其性能提升依然显著。

尽管目前 zano 仍处于研究尚被直接应用于 iPhone 或 Mac 设备,但这无疑显示出苹果在构建更强大的底层方面的雄心。未来,业内普遍认为 Manzano 技术很可能会融入苹果即将推出的 “图乐园 Image Playground” 功能,为用户提供更智能的修图体验和更想象力画面生成能力,从而进一步巩固苹果在端 AI 领域的竞争力。

via AI新闻资讯 (author: AI Base)
OpenAI与Cerebras达成百亿美元算力合作

OpenAI与Cerebras Systems签署了一项多年期协议,将使用后者的硬件获取相当于 750 兆瓦的算力,以支持其快速扩张的人工智能基础设施。根据OpenAI周三发布的声明,该公司将把Cerebras纳入其计算网络,以实现更快的响应速度。知情人士表示,这笔交易规模超过100亿美元。OpenAI联合创始人兼总裁格雷格·布罗克曼称,速度提升将有助于解锁“下一代应用场景,并让接下来的十亿用户接入人工智能”。Cerebras公司采用超大规模芯片处理信息,走出了一条不同于主流路线的技术路径。该公司正寻求其技术的广泛应用,以挑战市场领导者英伟达。

—— 金十数据路透社

via 风向旗参考快讯 - Telegram Channel