https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
Google Gemini接入Google Photos 支持从相册生成个性化AI图像

Google近日在 Gemini 中上线一项与 Google Photos 深度绑定的新功能,允许这款 AI 助手直接从用户的照片库中提取信息,用于生成更具个人化色彩的图像内容。Google的目标是让系统在创作 AI 图片时,能够“使用你和你所爱之人的真实影像”,而不是仅依赖用户在提示词中对外貌、家庭成员和个人风格进行冗长描述。

iframe (www.youtube.com)

这一改动属于Google更大范围“个人智能”(Personal Intelligence)战略的一部分,该战略旨在将 Gemini 与 Photos、Gmail、搜索、地图和 YouTube 等多款应用打通,以便在回答中融入更多个人上下文,从而看起来更加贴近用户。在图像生成方面,Gemini 将利用与 Google Photos 连接获得的照片信息自动补足细节,试图减少传统提示工程中那种需要写“迷你小说”级别长提示词的麻烦。

驱动这项功能的底层图像模型为 Nano Banana 2,这是Google近期升级的图像生成模型,官方将其定位为一种能更快速生成“看起来真的与你有关”的 AI 场景的手段。简而言之,如果用户同意开启该功能,Gemini 将在生成图片时自动参照用户相册中的相关照片,以调整人物外观、场景风格等元素,使结果更接近真实生活中的你和你的家人。

然而,功能刚一曝光,就引发了新一轮隐私警报和舆论争议。不少批评者担心,家庭合影、个人回忆乃至各种敏感照片会被进一步卷入“AI 内容工厂”,被转化为机器生成内容的一部分,强化了对“个人数据被再加工为 AI 生产资料”的恐惧。在微软 Recall 功能曾因隐私问题遭到强烈反弹的背景下,这类“深入终端用户私域数据”的 AI 创新显得格外敏感。

iframe (www.youtube.com)

从Google公开的信息来看,这并不是一项默认开启的服务,而是采用自愿选择的“选择加入”(opt-in)机制。Google表示,“个人智能”是可选功能,用户可以自行决定要将哪些应用与 Gemini 连接,首批接入 Photos 图像生成功能的对象则是美国地区符合条件的 Google AI 订阅用户。也就是说,Google目前并不会在用户不知情的情况下,直接对全部 Google Photos 相册执行扫描与分析操作。

在数据使用方面,Google强调 Gemini 应用不会直接利用用户的私人 Google Photos 图库进行模型训练。同时,用户在生成图像后可以点击“来源”(Sources)按钮,查看是哪一张照片被系统选作参考,用以指导当前结果的生成过程。这些说明试图缓解外界的部分担忧,并给用户提供一定程度的可见性和可追溯能力。

不过,这些保证并未完全打消质疑声音。隐私倡导者指出,所谓“可选”系统的可信度,很大程度上取决于企业对功能说明的清晰度与诚实程度,而大型科技公司在这方面的历史记录并不让人放心。即便没有直接用于训练,用户的私人影像被用于实时推理和内容生成这一事实,依然可能让许多人感到不安。

总体而言,当前的情况并非Google在暗中“一键开启”,对所有用户的照片库进行默认扫描。但“让 AI 在你的私人相册中自由游走、抽取记忆片段来生成新内容”本身,就是一个极易令普通用户产生心理防备的概念。在 AI 服务与个人隐私边界不断被重新划定的当下,这类围绕“个人智能”的产品尝试,很可能在未来一段时间内持续成为技术创新与隐私争议的焦点。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
OpenAI在佛罗里达州遭刑事调查涉及枪击案

佛罗里达州正对OpenAI发起一项刑事调查,涉及该公司的聊天机器人在去年佛罗里达州立大学一起致两人死亡的大规模枪击案中所扮演的角色。佛罗里达州总检察长乌特迈尔周二宣布了这项调查,称调查重点是嫌疑人与OpenAI的ChatGPT之间的信息交流。乌特迈尔的办公室已经查阅了部分通信内容,并表示ChatGPT似乎就袭击事件向嫌疑人提供了建议,包括所用枪支和弹药的类型。乌特迈尔说,ChatGPT还就一天中的作案时间以及校园内何处能遇到最多人等问题向嫌疑人提供了建议。OpenAI发言人表示,该公司认为ChatGPT对该枪击事件没有责任。在得知该事件后,OpenAI识别出一个据信与嫌疑人有关的账户,并主动与执法部门分享。

—— 华尔街日报

via 风向旗参考快讯 - Telegram Channel
DeepSeek API 异常(DeepSeek API Abnormal)

Apr 22, 18:23 CST
Investigating - We are currently investigating this issue.

via DeepSeek Service Status - Incident History
DeepSeek V4又在测试:被指接近Opus 4.5 但不会太便宜

这个月还剩下一周左右时间,最大的期待就是DeepSeek V4了,从种种迹象来看是越来越近了,而且官方近期也是动作不断,现在被发现API也开始升级模型了,性能还不错。从2月8日宣布上线了一个测试版之后,DeepSeek V4实际上一直都在低调变化,只是每次官方都没有详细介绍升级内容罢了。

前不久DeepSeek V4页面升级,有了快速、专家及视觉等三个模式可选,不过之前的升级主要是网页版,现在被发现API端的模型也在切换了。

只不过不确定这个模型具体的名字,分析下来是小参数量的那个DeepSeek V4 Lite可能性最大。

当然,惊喜还是有的,Linux.do社区有大佬提到了内测的信息,指出DeepSeek会有2个模型,可以调节思考挡位,支持FP8,指令遵循较强。

更重要的是,这里提到其表现接近Opus 4.5,只不过复杂任务比不上GPT。

虽然Anthrpoic已经发了Opus 4.6及4.7,但这两个大模型近期争议不断,降智、用量大增等问题直接引发了社区反弹,如果DeepSeek V4中较大的模型能达到Opus 4.5的水平,也绝对是开源大模型中的翘楚了,这个能力已经足够绝大多数开发者使用了,更何况还是国产开源的,限制比A家会少很多很多。

但是大家也要有个准备,DeepSeek V4的性能上来了,成本也不可能跟之前那样了,参数量大的那个模型价格也不会便宜。

虽然这里没说具体价格,但是比DeepSeek V3.X的肯定涨不少,但应该也不会达到Opus的水平,整体的性价比还是会有的。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)
抖音发布AIGC创作新规:严禁未经授权“换脸仿声”,强调真实消费体验

随着生成式AI技术的爆发,生活服务领域正迎来内容生产的变革。近日,《抖音生活服务AIGC创作规范》正式发布,旨在为人工智能生成内容(AIGC)划定清晰的法律与道德边界。新规的核心要求之一是保障消费者的知情权:创作者在发布包含AI生成或深度合成的内容时,必须进行显著标注,主动向用户声明内容的科技属性,不得隐瞒。

版权红线:严打“换脸仿声”侵权行为

在人格权与知识产权保护方面,该规范释放了严厉监管的信号。规范明确指出,未经合法、明确且可追溯的授权,创作者严禁利用他人肖像、声音或作品进行“换脸”、“仿声”及各类改编创作。此外,针对行业内屡禁不止的“搬运”乱象,规范严禁利用未经授权的素材或他人的脚本来训练AI模型并生成内容,从源头上保护原创者的核心权益。

商业准则:严禁虚构核心营销信息

针对团购带货等直接影响消费决策的行为,新规提出了“真实性”的高压线。创作者必须保证商品与服务信息的准确,严禁通过AIGC技术虚构门店实景、商品分量或服务流程。任何夸大效果、承诺无法兑现的服务,或制作引人误解的虚假宣传,都将被视为违规。平台强调,宣传推广的商品必须与线下实际履约的内容保持高度一致,确保用户“所见即所得”。

流量治理:拒绝低俗猎奇“博眼球”

为了净化内容生态,规范还对流量获取手段进行了约束。平台禁止创作者利用AI技术炮制与实际商品服务无关的猎奇剧情、低俗内容或虚假热点。对于试图通过AIGC制造违背公序良俗的内容来骗取流量的行为,平台将采取相应的治理措施,引导内容回归价值正向与真实服务的本质。

via AI新闻资讯 (author: AI Base)
特斯拉中国车机将接入豆包AI大模型

据网信上海消息,特斯拉车机语音大模型服务于4月20日完成备案。《科创板日报》从知情人士处获悉,特斯拉车机语音服务将接入豆包大模型。值得一提的是,此前特斯拉中国官网的《特斯拉车机语音助手使用条款》显示,特斯拉 Model Y L 车型将搭载豆包大模型与DeepSeek模型,两款模型均通过火山引擎接入。其中,豆包大模型将承担语音命令功能,如导航设定、媒体播放操控、空调温度调节等,同时还具备车主手册查询功能;DeepSeek模型提供人工智能互动服务。

—— 科创板日报

via 风向旗参考快讯 - Telegram Channel
抖音发布新规:禁止未经授权使用他人肖像、声音及作品进行 AIGC 创作

抖音生活服务近期发布了《抖音生活服务 AIGC 创作规范》,明确了在人工智能生成内容(AIGC)或深度合成技术创作过程中,创作者应遵循的基本原则和具体规范。根据新规,创作者必须保障消费者的知情权,并在发布人工智能生成的合成内容时,主动声明该内容中包含生成合成的成分。

此外,创作者在使用他人肖像、声音和作品时,必须获得合法、明确且可追溯的授权。禁止在 AIGC 创作中使用未经授权的素材,或盗用他人脚本进行训练和生成内容。这意味着创作者需要对所使用的内容负责,以维护他人的人格权和知识产权。

新规还强调,创作者需确保商品和服务信息的真实准确,绝不能制作虚假或可能误导消费者的内容。所宣传的商品信息必须与实际商品详情及线下履约情况保持一致。特别是在营销中,严禁通过 AIGC 虚构商品、门店或服务等核心信息,亦不可夸大商品的分量、规格、效果或承诺无法兑现的服务。

via AI新闻资讯 (author: AI Base)
DeepSeek API 实现百万 Token 上下文升级

DeepSeek 官方宣布其 API 已成功更新至与其 App 和网页版相同的百万 Token 上下文版本,这标志着技术的一次重要飞跃。此前,DeepSeek 的上下文容量仅为128k tokens,而此次更新后,用户能够享受到更长的上下文信息,极大地提升了对话的连贯性和信息的丰富性。

与此同时,DeepSeek 的知识库也进行了全面的更新,现在已更新至2025年5月,这意味着用户在非联网状态下也能准确获取到2025年4月的最新新闻。这一进展不仅体现了 DeepSeek 在信息更新和处理能力上的增强,也展示了其为用户提供更优质服务的决心。

需要指出的是,DeepSeek 当前仍为非多模态模型,仅支持文本和语音输入,而不支持视觉输入。这一局限性也提醒用户在使用过程中,需根据自身需求选择合适的交互方式。

DeepSeek 的创始人梁文锋此前已透露,新一代旗舰大模型 DeepSeek V4将于4月下旬发布。随着技术的不断迭代,DeepSeek 的功能也在不断增强,包括日前上线的专家模式,该模式专注于复杂问题的解答,进一步拓展了其应用场景。

via AI新闻资讯 (author: AI Base)
OpenAI豪掷 15 亿美元布局B端:新合资公司“DeployCo”浮出水面

4 月 22 日,人工智能巨头 OpenAI 传出重磅投资动向。据知情人士透露,OpenAI 已承诺向一家与私募股权公司新成立的合资企业注资至多 15 亿美元。此举被外界普遍视为 OpenAI 加速商业化落地的关键一步,旨在全球企业级人工智能工具市场中抢占先机,并与老对手 Anthropic 展开正面对决。

融资细节:分阶段投入与高额估值

据悉,这笔投资将分步进行。OpenAI 计划首先注入 5 亿美元的股权资金。得益于巨头的背书,该合资企业的起始估值预计将达到 100 亿美元,首轮融资有望在 5 月初正式收官。此外,OpenAI 还保留了未来追加 10 亿美元投资的权利,显示出其对该业务版图的长期看好。

落地部署:内生力量助攻技术内嵌

这家在内部被称为“DeployCo”的新实体,其核心使命是消除技术与应用之间的鸿沟。目前,DeployCo 已经开启了大规模的人才招募计划,除了对外吸引顶尖人才,OpenAI 内部也有一部分精英团队转岗至此。

在业务模式上,DeployCo 将扮演“技术向导”的角色,通过向客户收取服务费,协助各类企业将先进的 AI 技术深度嵌入其业务流程中。这种“交钥匙”式的服务模式,不仅能为企业解决技术落地难的痛点,也将为 OpenAI 开辟出除了订阅服务之外的又一重要营收增长点。

via AI新闻资讯 (author: AI Base)
抖音生活服务发布AIGC创作规范:团购带货视频严禁AI生成实景

随着人工智能生成内容(AIGC)的普及,抖音生活服务平台近期正式发布了《抖音生活服务AIGC创作规范》。该规范的核心主旨在于强化内容的透明度与真实性,要求所有创作者在发布由人工智能生成或合成的内容时,必须主动、清晰地标注声明,确保用户的知情权。

严打侵权搬运,保护原创视听素材

在版权与人格权保护方面,新规划定了严格的边界。未经合法、明确且可追溯的授权,创作者不得利用他人的肖像、声音或作品进行“换脸”、“仿声”及各类改编创作。此外,平台严禁使用未经授权的素材或盗用他人脚本进行AI模型训练和内容生成,旨在从源头上遏制技术滥用导致的侵权乱象。

关联类目从严监管,禁止AI替代实景服务

针对与消费者切身利益密切相关的重点行业,如餐饮、住宿、游玩、洗浴按摩、丽人、维修及家政等,规范提出了更为具体且严格的要求。在发布上述行业的团购带货视频时,商品展示、实际场景、服务过程以及最终效果等关键信息,严禁使用AI技术生成的虚假内容替代。

这一规定意味着,生活服务类短视频必须回归“真实体验”,禁止通过AIGC手段虚构服务环境或夸大服务效果,以保障消费者在购买团购产品时所见即所得,维护公平健康的线上消费环境。

via AI新闻资讯 (author: AI Base)
谷歌内部政治导致其在AI编程领域落后

在谷歌,领导们对于在提供AI编程工具的竞赛中落后感到焦虑,尤其是当像Anthropic这样的竞争对手向企业提供更有效且更受欢迎的工具时。谷歌现在正努力将其部分编程项目统一在一个旗号下,以加速进展并利用客户兴趣激增的优势。据现任和前任员工及高管称,在谷歌的一些部门,特别是AI实验室DeepMind,对公司地位的担忧正在加剧。据这些人士称,其Gemini模型的能力分散在六个不同品牌的不同编程产品中,这表明公司缺乏专注和内部相互竞争的努力如何阻碍了成功。甚至在内部,一些谷歌工程师也更喜欢使用Anthropic的Claude Code。更令人担忧的是那些根本难以采用AI编程的工程师。

—— 彭博社

via 风向旗参考快讯 - Telegram Channel
抖音发布生活服务AIGC创作规范:严禁未经授权使用他人肖像及声音

4月22日,抖音生活服务正式发布《抖音生活服务AIGC创作规范》,旨在明确创作者在使用人工智能生成内容或深度合成技术时的行为边界,进一步保障消费者知情权并维护健康的内容生态。

该规范核心聚焦于权益保护与信息真实性。在人格权与知识产权方面,抖音明确严禁未经合法、明确且可追溯的授权,利用AIGC技术对他人的肖像、声音或作品进行换脸、仿声及改编等二次创作。同时,创作者不得利用未经授权的素材或盗用他人脚本进行模型训练。针对消费端透明度,规范要求所有包含生成合成内容的发布必须主动声明,确保受众清晰识别虚实边界。

在营销合规性上,规范严击利用AIGC虚构商品、门店或服务信息,禁止夸大分量、规格及效果,要求线上宣传必须与线下履约保持严丝合缝。此外,针对行业内利用AI技术制造低俗剧情、伪造热点以博取流量的乱象,抖音明确表示将严厉打击与商品服务无关的猎奇内容,确保内容价值导向正向。

此次规范的推出,标志着头部平台在AIGC内容治理上进入精细化阶段。通过从技术源头到营销端的全链条约束,不仅有效降低了侵权风险与信任成本,也为AI技术在本地生活服务领域的合规化应用树立了行业标杆。

via AI新闻资讯 (author: AI Base)
千问AI PPT重大升级:智能体架构赋能,全流程自动化制作

4月22日下午,千问AI PPT宣布完成“PPT Agent”重大升级,通过采用全新的智能体架构,成功实现了从内容构思、素材检索到视觉排版的全流程自动化。这一升级标志着AI在办公自动化领域的进一步深化,将大幅提升PPT制作效率与质量。

在实际使用中,用户只需输入相关需求,千问即可在1-3分钟内生成一个可直接下载使用的标准PPT文件。输入侧支持批量上传最多10个文件,涵盖文档、PDF、代码等多种格式,由AI自动提炼核心信息并整合为演示文稿。输出侧则提供了极高的自由度,用户可根据需要编辑文字、调整图片位置及图表数据等。此外,多语言、中英混排能力也同步上线,满足了英语教学等特定场景的刚需。

为进一步降低使用门槛,提升输出质量的稳定性,千问官方还同步发布了“高分提示词公式”。该公式指导用户根据教学定位、内容设计、视觉呈现、互动设计及输出规范来完善提示词,将模糊的需求转化为结构化的指令,提升了人机交互的效率与精准度。

目前,千问AI PPT的这一全新功能正在逐步全量免费开放中。用户可通过PC端及网页版(qianwen.com)进行体验。

在AI大模型技术日新月异的背景下,千问AI PPT的此次升级正是AI Agent技术落地办公场景的典型案例。通过智能体架构实现复杂任务的全流程自动化,不仅提升了单一工具的效能,更预示着未来AI将不再仅是辅助工具,而是能够独立承担并优化复杂工作流的智能助手。这对于推动办公数字化转型、提升社会整体生产力具有重要意义。

via AI新闻资讯 (author: AI Base)
OpenAI 推出 Euphony:一款开源的 Harmony 数据可视化工具

在调试人工智能代理时,开发者面临着比普通函数调试更复杂的挑战。这些 AI 代理通常涉及多个步骤,如读取文件、调用 API、编写代码等,而传统的堆栈跟踪方法并不适用。为了帮助开发者更有效地分析和理解 AI 代理的工作过程,OpenAI 团队推出了 Euphony,这是一款开源的浏览器可视化工具,旨在将结构化的 Harmony 聊天数据和 Codex 会话日志转化为易于理解的对话视图。

Euphony 的核心是一个 Web 组件库和独立的 Web 应用程序,可以接收 Harmony 格式的 JSON/JSONL 数据或 Codex 会话 JSONL 文件,并在浏览器中以结构化的对话时间线形式展示。这款工具具有友好的用户界面,支持通过多种方式加载数据,包括直接粘贴 JSON 数据、从本地文件加载,或通过公共 URL 加载数据。Euphony 能自动识别数据格式,并根据不同情况进行相应的渲染。

除了基本的渲染功能,Euphony 还提供了丰富的元数据检查面板,便于开发者在用户界面中查看对话和消息的详细元数据。这在处理带有额外字段的注释数据集时特别有用。开发者还可以利用基于 JMESPath 的过滤功能,精准筛选出所需的信息。此外,Euphony 还具备焦点模式、网格视图和浏览器内编辑功能,方便用户在一个平台上进行各种操作。

Euphony 提供了两种运行模式:仅前端模式和后端辅助模式。在前端模式下,整个应用可以在浏览器中独立运行,无需依赖服务器。而在后端辅助模式下,使用 FastAPI Python 服务器来处理大型数据集的加载和渲染。这一设计充分考虑了开发者在使用过程中的便利性和安全性。

对于 AI 开发团队来说,Euphony 的一个亮点是它以可重用的 Web 组件形式提供,能够轻松嵌入到各种前端框架中。用户可以通过 CSS 自定义样式,灵活调整界面的外观和风格。

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]