https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
高德发布汽车出行 AI Agent:基于千问大模型实现主动意图理解

4月23日,高德地图正式发布汽车出行 AI Agent,标志着车载导航从传统的“被动指令响应”向“主动意图理解”实现范式跃迁。该系统基于千问大模型底座,构建了“语言大脑”与“空间大脑”的双引擎架构,前者负责解析日常语言甚至模糊表达,后者则在真实物理世界中验证意图并匹配路径资源。此次发布核心解决了智能座舱中“人适应系统”的痛点,通过具备推理与记忆能力的任务处理,使车载导航能够完成复杂行程的一句话串联、动态空间路线推理及多轮对话式编辑。

技术层面,高德汽车出行 AI Agent的突破在于其感知时间、空间与情境的主动服务能力。例如,系统可实时监测剩余电量并在路线中自动插入充电节点,或在感知交通事故、施工拥堵前提前计算绕行方案,在用户察觉前完成路线优化。这一迭代预示着智能座舱的研发重点将从“语音识别与指令映射”全面转向“意图理解与能力协同”,车企与地图供应商的关系也将由传统的 SDK 集成演进为深度的 Agent 能力融合。

从行业趋势看,AI Agent 原生座舱的出现,意味着车载场景正成为大模型落地的核心杀手级应用。高德此举不仅重塑了人机交互逻辑,更通过打通空间数据与语义理解,为未来自动驾驶时代的个性化出行服务奠定了基础设施。

via AI新闻资讯 (author: AI Base)
彭博社:阿里巴巴旗下AI助手千问首次开放Agent技术 接入东方航空

4月23日,彭博社报道称,阿里巴巴旗下AI助手千问首次向其主要商业伙伴开放Agent技术,接入中国东方航空公司航班,帮助用户用AI预订机票,这将有助于产生“全新”种类的需求。

据介绍,用户现在可以通过自然语言指令在千问中完成航班查找、出票、选座和登机等全流程操作,无需再使用传统的屏幕菜单界面。千问还将提供根据实时交通状况,计算前往机场所需时间,并预订车辆等延伸服务,实现从出行规划到登机的一站式体验。

报道称,阿里巴巴正将其面向消费者的人工智能产品整合到 Qwen 中,这是一款“全能”应用,阿里正在将千问打造为一个集服务、交易和主动用户支持于一体的平台。

via AI新闻资讯 (author: AI Base)
谷歌地图即将迎来重大人工智能功能更新

谷歌为其地图和地理空间应用推出了新AI功能,这些功能是专为企业用户设计的。其中一项名为“Maps Imagery Grounding”的新功能,允许企业用户使用生成式人工智能在谷歌街景中创建逼真的场景,以可视化某个特定项目可能的外观。用户只需在 Gemini企业代理平台中输入提示,然后该平台就会在街景中呈现出场景,只要在谷歌地图图像中启用了正确的设置。该公司还在扩展用户在谷歌地球中分析卫星图像数据的方式。一项名为 “空中与卫星洞察” 的新功能允许用户分析存储在谷歌云BigQuery中的图像。谷歌声称该功能将数周工作量缩短为仅仅几分钟。

—— Techcrunch

via 风向旗参考快讯 - Telegram Channel
SpaceX计划自研GPU 警告投资者芯片供应和成本问题

SpaceX或许正在解决芯片行业最大的挑战之一:制造驱动人工智能的关键部件——图形处理器(GPU)。在SpaceX预计于今年夏季进行目标估值达1.75万亿美元的 IPO 之前,该公司已向潜在投资者发出警告,称其计划投入巨资开发人工智能和其他技术。

据SpaceX的S-1注册文件节选显示,该公司将“制造我们自己的GPU”列为其正在进行的“重大资本支出”之一。公司在上市前需向美国证券交易委员会提交S-1文件,以披露其风险和财务状况。

此前,SpaceX及其xAI部门宣布与特斯拉合作,共同开发Terafab——一座位于德克萨斯州奥斯汀的先进人工智能芯片制造中心,由首席执行官埃隆·马斯克规划建设。

尽管马斯克曾表示该项目将生产用于汽车、人形机器人和太空数据中心的芯片,但包括将生产的人工智能芯片类型(例如GPU)在内的许多细节仍不为人知。

人工智能芯片的设计方案多种多样。例如,英伟达主要生产GPU,这种芯片用途广泛,擅长执行各种数据处理任务。Alphabet旗下的谷歌则采用了另一种方案,其张量处理单元(TPU)经过专门优化,能够执行特定功能,这对于构建人工智能模型和运行聊天机器人(例如Anthropic公司的Claude)至关重要。

目前尚不清楚SpaceX何时计划生产自己的芯片,也不清楚哪些公司——Terafab的开发商或其合作伙伴英特尔——将负责工厂内部的制造技术。

马斯克周三告诉分析师,等到Terafab规模扩大时,英特尔的下一代14A制造工艺“可能已经相当成熟或可以投入使用”,而且“这似乎是正确的选择”。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
用户警惕!Anthropic Claude Desktop 被指悄悄安装间谍软件

网络安全专家亚历山大・汉夫(Alexander Hanff)在个人博客上曝光了 Anthropic 公司的 Claude Desktop 应用存在安全隐患。他指出,该应用在用户不知情的情况下,向 Chrome、Brave、Edge 等七款 Chromium 浏览器 “静默安装” 了 Native Messaging 桥接文件,具有潜在的间谍软件能力。

根据汉夫的调查,当用户安装 Claude Desktop 后,该应用会自动将名为 com.anthropic.claude_browser_extension.json 的桥接文件写入多款浏览器的配置目录,甚至在用户未安装某些浏览器的情况下也会创建相关目录。这种做法意味着,如果用户未来安装了这些浏览器,Claude 扩展将无需再次征求用户同意便可获得相关权限。

该桥接文件的主要功能是允许特定的浏览器扩展调用本地可执行程序。根据 Anthropic 的官方文档,该组件具备强大的浏览器自动化能力,能进行诸如打开新标签页、共享登录状态、读取 DOM 内容、填充表单以及录制屏幕等操作。这使得一旦用户安装了相应的扩展,Claude 便能以用户身份访问敏感网站,包括银行和税务等,并且可在浏览器沙箱之外运行,具有用户级权限。

汉夫还指出,Anthropic 官方数据显示,其 Chrome 扩展在遭遇恶意攻击时,提示词注入的成功率约为 11.2%,这为攻击者提供了通过受感染扩展或恶意网页接管用户浏览器会话的风险。汉夫认为,这种未经授权的行为触犯了多项安全原则,包括强制捆绑和信任边界的突破,并且用户无法通过常规界面发现或管理该组件。

汉夫呼吁,Anthropic 应立即移除该组件,或在明确告知用户并获得授权后再进行安装。这一事件提醒用户在安装软件时要提高警惕,确保自身的隐私和数据安全。

划重点:

🌐  汉夫指出 Claude Desktop 应用未经用户同意,向多个浏览器安装桥接文件。

🔍  安装的桥接文件可使扩展程序具备强大的浏览器自动化能力,存在安全隐患。

⚠️  汉夫呼吁 Anthropic 应移除该组件,或在获得用户授权后再进行安装。



via AI新闻资讯 (author: AI Base)
微软正式重塑 Edge 浏览器界面,呈现统一的 AI 风格

微软近日确认,将对其 Edge 浏览器的界面进行全面重构,旨在为用户更加统一的 体验。科技媒体 Windows Latest 的报道,微软计划在 Edge 浏览器中全面采纳 Copilot 和 Bing 的语言,这一改动将为用户带来跨平台的一致体验。

此次重构将强化圆角设计,深度融合 Copilot 风格。微软希望通过调整界面的圆角弧度、间距布局、字体样式和默认配色等视觉元素,创造出一种全新的视觉效果。用户在使用 Edge 浏览器时,可以在不同的 AI 接口之间感受到一致的设计风格,这一变化预计将有助于提升 Copilot 在市场上的接受度。

根据此前的泄露截图,新版 Edge 浏览器在标签页、快捷方式以及右键菜单等各个方面都采用了更加柔和的圆润线条。此外,设置页面的开关控件也被调整为符合 Copilot 风格,以增强整体的协调性。

微软表示,这一界面重构的计划正在推进中,重构后的 Edge 浏览器将为用户提供更好的使用体验。随着这些变化的实施,用户在日常使用中将会更加便捷,享受到更为流畅的浏览体验。

划重点:

🌐 微软将重构 Edge 浏览器界面,提升用户的 AI 体验。

🎨 新界面将采用圆角设计,并融合 Copilot 风格。

🖥️ 重构计划已在推进,预计将增强用户的操作便利性。


via AI新闻资讯 (author: AI Base)
美国沃伦参议员警告:AI 行业泡沫可能引发新一轮金融危机

近日,美国民主党联邦参议员丽莎白沃伦在盛顿的一活动中发警告,表示 AI 行业正面临着类似于 2008 年金融危机的风险。沃伦指出,AI 行业的快速发展和大量资金的投入可能导致泡沫的形成,威胁到整个金融系统的稳定。

沃伦强调,虽然人工智能技术潜力巨大许多 AI 正在以高杠杆的方式融资,造成了不健康的财务状况。她提到,AI 企业的收入增长速度跟不上支出的增加,导致这些公司不得向不透明的私募信贷基金等融资渠道寻求资金。这些融资方式的缺乏监管,使得 AI 行业的整体安全性受到质疑。

在谈到潜在的风险时,沃伦表示,如果 AI 公司无法迅速提高收入,就很难承担沉重的债务负。而一旦出现务问题,可能会出现慌性抛,造成广的金融动。她形地比喻道种情况就像一名登山者把绳子绑在自己身上,而绳子的另一端却牵连着多个地方,一旦其中一处出现问题,所有地方都会受到影响。

沃伦进一步建议,国会应成立一个新的数字监管机构,专门负责 AI 行业的反垄断、隐私和消费者保护等方面的事务。同时,她强调,如果 AI 行业出现问题,不应对其进行救助,以维护市场的问责制。

沃伦的警告引发了与会者的广泛关注,许多人对此表示深思。当前,AI 行业的快速发展是否会成为金融市场的新隐患,值得关注和思考。

via AI新闻资讯 (author: AI Base)
字节跳动推出全新3D 生成模型 Seed3D2.0,技术跃升至 SOTA 水平

字节跳动近日正式发布了其最新一代3D 生成大模型 ——Seed3D2.0。此次发布标志着技术的重大进步,Seed3D2.0在几何和纹理材质生成方面达到了 SOTA(最先进的技术)水平。根据字节跳动的介绍,Seed3D2.0的技术报告现已公开,同时相关 API 也已上线,方便开发者进行应用。

在与当前市场上主流3D 生成模型的对比中,Seed3D2.0显示出了卓越的性能。特别是在几何生成和纹理材质生成这两项关键指标上,该模型的表现都超越了其他竞争者。通过对复杂结构的更精细还原,以及更真实的 PBR 材质生成,Seed3D2.0在行业中树立了新的标杆。

为了验证 Seed3D2.0的效果,字节跳动招募了60位拥有3D 建模经验的评审人员,对其与其他六个主流模型的生成质量进行了盲评。结果显示,Seed3D2.0在几何结构生成的评测中明显领先,偏好率超过其他模型,验证了其架构创新带来的几何质量提升。在纹理生成的对比中,Seed3D2.0的偏好率同样高达69% 以上,显示了其强大的市场竞争力。

Seed3D2.0采用了 Coarse-to-Fine 的两阶段生成策略,成功将整体结构与几何细节解耦,实现了对锐利边缘、薄壁结构及复杂拓扑等生成难点的突破。同时,模型也整合了统一的 PBR 生成机制,进一步提升了材质的细节和边界精度。通过引入 VLM 先验技术,Seed3D2.0在未知光照条件下的材质分解表现更加稳定与准确。

除了几何和纹理生成,Seed3D2.0还具备部件级分割与补全、铰接资产生成以及基于图像、视频或文本的场景组合生成能力,进一步拓宽了其在实际应用中的场景。

划重点:

🌟 Seed3D2.0在几何和纹理生成领域取得了 SOTA 水平,显著提升了生成质量。

🖼️ 该模型在盲评测试中表现优异,显示出高于69% 的偏好率。

🔧 引入了 Coarse-to-Fine 策略和 VLM 先验,增强了生成的稳定性和准确性。


via AI新闻资讯 (author: AI Base)
GPT Image2 背后团队首度曝光: 13 人核心团队, 4 个月重塑AI绘图

近期,GPT Image2凭借极其惊艳的生成效果在社交媒体上引发轰动。随着项目的走红,这支低调的幕后团队也逐渐浮出水面。据了解,该核心团队仅由13人组成,在短短4个月内便完成了底层架构的彻底重写。尽管研究负责人陈博远并未透露具体的技术路线,但他将这一新模型描述为“图像领域的GPT”,预示着其在通用性上的巨大飞跃。

作为团队的灵魂人物,陈博远的成长历程颇具传奇色彩。他在读博期间便提出过“Diffusion Forcing”等创新范式,并曾在Google参与开发后续被Gemini2.0采用的指令微调技术。有趣的是,他在高中参加科研营时甚至还不懂Python。在加入OpenAI后,他不仅负责了GPT图像模型的所有训练工作,还是Sora视频生成团队的核心成员。在演示中,他通过生成精准渲染中、韩、孟加拉语等多种文字的海报,展示了模型卓越的语言处理能力。

除了文字渲染,GPT Image2在理解世界知识和指令遵循方面也达到了新高度。由中科大博士Jianfeng Wang负责的这一模块,解决了生图AI长期以来的痛点——例如,过去模型画的时钟几乎永远停在10:10,而新模型已能精准理解任意时间点及复杂的空间布局指令。他表示,该模型正在消除用户的创作意图与最终产出之间的鸿沟。

在生产力工具化方面,来自浙大竺可桢学院的Yuguang Yang演示了将长篇论文一键转化为高精度PPT和信息图表的能力。这得益于团队在多模态理解、MoE(混合专家模型)架构以及长程引导技术上的深度融合。

从最初的DALL-E到如今的GPT Image2,这支平均年龄极轻、背景多元的团队(包含多位2025年刚毕业的博士)完成了从“画得出”到“画得准”的进化。目前,团队成员纷纷将社交头像换成了极简的日系贴纸风格。这种带有几分戏谑色彩的自嘲,或许正是这群信奉“涌现式研究”的天才们改变世界的一种独特方式。

via AI新闻资讯 (author: AI Base)
字节跳动发布新一代3D生成大模型Seed3D 2.0,技术精度与真实感实现跨越式提升

在生成式AI领域,3D内容的构建正成为技术竞争的新高地。近日,字节跳动正式对外推出了精度更高的新一代3D生成大模型——Seed3D2.0。该模型的最新技术报告已同步公开,且相关API接口也已在火山引擎平台正式上线。

根据对比评测数据显示,Seed3D2.0在几何形状生成以及纹理材质建模这两项关键指标上,均成功取得了SOTA(当前最优)的成绩。这意味着该模型在处理复杂物体结构时,能够还原出更精细的锐利边缘和薄壁构造。而在PBR(基于物理的渲染)材质生成方面,其表现出的真实感与光影稳定性也显著优于现有的主流模型。

为了验证实际应用中的用户感官,字节跳动招募了60位拥有专业经验的3D建模师进行盲评。在纯几何结构的生成测试中,Seed3D2.0展现了压倒性的优势;而在带有纹理贴图的综合测试中,其相对于行业内其他主流模型的偏好率超过了69%,验证了其架构创新带来的质量飞跃。

从技术实现路径来看,Seed3D2.0引入了从粗到精(Coarse-to-Fine)的两阶段生成策略。这种方法通过将“整体结构”与“局部细节”解耦并分开优化,攻克了复杂拓扑结构难以还原的痛点。同时,模型采用了MoE(混合专家)架构来提升高分辨率下的材质细节,并引入视觉语言模型(VLM)先验,确保了在未知光照环境下的材质分解更具准确性。

除了基础的几何与纹理生成,该模型还展示了强大的实用化潜力。目前,Seed3D2.0已具备部件级分割补全、铰接资产生成以及基于多模态输入的场景组合能力。这些特性的加入,使得生成式3D模型不再停留于实验室阶段,而是能够更直接地应用于游戏开发、仿真场景构建等实际业务部署中。

via AI新闻资讯 (author: AI Base)
大模型购票时代开启:东航首家接入通义千问实现全流程AI服务

随着人工智能技术的深度演进,传统的航空出行服务正迎来颠覆性变革。今日,中国东方航空正式与阿里通义千问达成战略合作,通义千问也由此成为首个全面接入东航服务的国产大模型。这一举措标志着AI机票服务正式进入全流程时代,有望重塑现有的机票销售格局。

此次深度整合彻底改变了以往依赖OTA(在线旅行社)或反复切换APP的繁琐流程。在新的服务模式下,用户只需在通义千问的AI对话界面中,以自然语言输入自己的行程计划或个人偏好,AI便能代替人工完成复杂的查询与比对工作。它不仅能精准推荐最适配的东航航班,还能辅助用户直接在对话框内完成购票、选座以及值机等一系列操作。

值得注意的是,这种“直连”模式在售后保障上也更具优势。通过AI渠道完成的订单,将由东航官方直接提供退改签支持,规避了第三方平台可能存在的沟通滞后或加价风险。

据了解,双方的合作并未止步于交易层面。未来,该AI服务还将进一步打通会员体系,接入更多个性化的会员权益与服务。这不仅是航空公司数字化转型的一次大胆尝试,也预示着大模型正从单纯的“聊天工具”向具备实操能力的“全能助手”加速蜕变。

via AI新闻资讯 (author: AI Base)
字节跳动发布Seed3D2.0:几何与纹理双SOTA,API同步上线火山引擎

字节跳动Seed团队于2026年4月23日正式发布新一代3D生成大模型Seed3D2.0,标志着AI3D内容生成向“生产级可用”迈出关键一步。 该模型在几何精度与材质真实度上实现显著突破,核心指标均达到行业SOTA水平,有效解决了此前3D生成中边缘软化、拓扑失真及材质物理一致性缺失等行业痛点。

技术层面,Seed3D2.0引入了“粗到精”的两阶段DiT架构,通过将整体结构与几何细节解耦,极大提升了对锐利边缘和薄壁结构的还原能力。在纹理生成上,模型升级为统一的PBR生成架构,并结合MoE架构与VLM先验,实现了高分辨率下的物理属性精准分解。

评测数据显示,Seed3D2.0在几何生成与纹理生成的人类偏好率分别超过80%与69%,大幅领先现有主流模型。

此外,Seed3D2.0进一步拓展了下游应用边界,支持部件级拆解、关节化建模及复杂场景组合,生成的3D内容可无缝对接Isaac Sim等物理仿真引擎。

目前,该技术报告已公开,API也同步上线火山引擎。随着3D生成从单体模型迈向可交互、具身智能化的场景级构建,Seed3D2.0的发布不仅将加速工业制造与仿真训练的数字化进程,也为具身智能的规模化落地提供了关键的基础设施支撑。

项目主页:

https://seed.bytedance.com/seed3d_2_0

体验入口:

火山方舟体验中心-登录-选择视觉模型-3D生成-Doubao-Seed3D-2.0

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]