ChatGPT / AI新闻聚合

https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN

1 天前

Mistral AI发布企业级编排工具Workflows，支持 Python 开发与人工审批

4月28日，Mistral AI宣布推出其企业级 AI 编排层Workflows。作为Mistral Studio平台的关键组成部分，该工具旨在协助企业将零散的 AI 驱动流程转化为可大规模投入生产的系统。目前，Workflows已进入公开预览阶段，吸引了包括ASML、ABANCA及CMA-CGM在内的多家跨国巨头将其应用于核心业务流程。

在技术架构上，Workflows基于高性能Temporal引擎构建，允许开发人员使用 Python 定义复杂流程。其核心优势在于引入了“人工在环”审核机制，仅需一行代码即可在关键节点（如货物放行或数据规格检查）暂停工作流以待人工审批。在保障安全合规的前提下，Mistral AI负责业务编排，而核心敏感数据则保留在客户自有系统内部。员工可通过Le Chat聊天机器人直接触发这些自动化序列。

此次发布标志着Mistral AI补齐了从底层模型到应用编排的全栈能力。在过去一年中，该公司相继推出了用于多智能体协作的Agents API以及开源模型Mistral Small4。近期，Mistral AI更获8.3亿美元融资用于扩建巴黎数据中心。随着企业 AI 需求从“简单的对话”转向“复杂任务自动化”，Workflows的推出将直接加速 AI 技术在严谨商业场景中的工程化落地。

via AI新闻资讯 (author: AI Base)

1 天前

欧盟未能就人工智能法规达成协议，谈判将在下月恢复

在经过长达 12 小时的谈判后，欧盟各国代表和欧洲议会立法者未能就即将出台的人工智能（AI）法规达成一致。这项法规被认为是全球最严格的人工智能监管措施之一，旨在应对该技术对社会和经济带来的潜在风险。此次谈判于 4 月 29 日举行，虽然各方都认识到推动法规的重要性，但最终仍然因分歧而未能达成协议。

根据计划，新的人工智能法案预计将在 2024 年 8 月生效，其中的关键规定将分阶段实施，以便逐步适应市场的需求。这些法规是欧盟 “数字综合法案” 的一部分，意在简化数字领域的监管，以增强企业在国际竞争中的地位。许多行业，包括生物识别、公共服务和医疗健康等 “高风险” 领域，将面临更严格的技术使用要求。

塞浦路斯担任欧盟理事会的轮值主席国，其官员表示，尽管各方进行了长时间的磋商，但仍无法达成一致。荷兰议员金・范・斯帕伦塔克对此表示失望，并批评大科技公司可能会因监管混乱而受益，反而影响到那些重视安全并提前做好准备的欧洲企业。

谈判在多个国家和立法者坚持豁免一些已经受到行业法规约束的领域后陷入僵局。未来几周，谈判有望重新开启，这将是确保人工智能法规顺利推行的关键时刻。

划重点：

🌍 欧盟与欧洲议会在人工智能法规谈判中未能达成协议，将于下月恢复讨论。

📅 新法规计划于 2024 年 8 月生效，关键条款将分阶段实施。

🚨 部分国家主张豁免某些行业，导致谈判陷入僵局。

via AI新闻资讯 (author: AI Base)

1 天前

前推特 CEO 创办的 AI 初创公司获融资，估值达 20 亿美元

via AI新闻资讯 (author: AI Base)

Telegraph

前推特 CEO 创办的 AI 初创公司获融资，估值达 20 亿美元

前推特首席执行官 Parag Agrawal 创办的初创公司 Parallel Web Systems 近日成功完成了一轮 1 亿美元的 B 轮融资，使公司的估值飙升至 20 亿美元。这轮融资由著名风险投资公司 Sequoia Capital 领投，现有投资者 Kleiner Perkins、Index Ventures 和 Khosla Ventures 也参与其中。目前，Parallel 在加利福尼亚州帕洛阿尔托拥有约 50 名员工。公司在去年 11 月进行的 A 轮融资中筹集了 1 亿美元，当时估值为…

1 天前

Google Translate 迎来 20 周年，新增发音练习功能

Google 介绍，Google Translate 目前支持近 250 种语言和逾 6 万个语言对，覆盖全球约 95% 人口；每月有超过 10 亿用户使用，月翻译量约 1 万亿词。产品已从早期统计机器学习转向神经网络，如今结合 Gemini 模型和 TPU 持续优化翻译能力。

20 周年新增“发音练习”功能，可在 Android 版应用中用 AI 分析语音并即时反馈，现已在美国和印度向英语、西班牙语、印地语开放。文中还提到 Live translate、离线翻译、Lens 视觉翻译和 Circle to Search 等用法。

Google

🌸 在花频道 · 茶馆讨论 · 投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel

1 天前

商汤发布原生理解生成统一模型 SenseNova U1 告别插件式AI

国产人工智能领域再次迎来技术性突破。 4 月 28 日晚间，商汤科技正式向外界展示并开源了其最新研发成果——“日日新SenseNova U1”系列。这一系列被定义为“原生理解生成统一模型”，其核心价值在于打破了以往多模态模型依赖于不同模块“拼接”的传统思路。

摒弃“拼接”逻辑，实现架构统一

长期以来，多模态大模型大多采用将视觉模块与语言模块进行拼合的模式，这种“拼接式”设计往往导致信息在不同表征空间传递时产生损耗。而 SenseNova U1 系列基于商汤今年 3 月自主研发的 NEO-unify 架构，成功在单一模型框架内实现了多模态理解、推理与生成的深度统一。

这种技术路径的转变，构建了一个统一的表征空间。这意味着模型在处理信息时，语言与视觉信号能够实现更高效的协同。在实际表现中，这种架构不仅增强了模型对复杂信息的感知深度，也让生成能力的自然度和精准度同步得到显著提升。

轻量版率先开源，未来空间可期

为了促进开源社区的共同发展，商汤此次率先推出了 SenseNova U1 Lite 轻量版。该版本包含两个规格的模型，旨在满足不同应用场景下的性能平衡需求。目前，相关模型的代码及文件已正式上线相关开源平台。

商汤方面透露，目前的轻量版仅仅是开始，未来计划推出体量更大、参数更丰富的模型版本。业内专家认为，这种原生统一架构的成熟，将为自动驾驶、智能硬件以及更复杂的工业协作等领域打开全新的应用想象空间，标志着国产AI正在从“功能叠加”向“结构进化”迈进。

via AI新闻资讯 (author: AI Base)

1 天前

商汤科技开源日日新 SenseNova U1，实现多模态原生统一架构

商汤科技于 28日正式发布并开源日日新 SenseNova U1系列原生理解生成统一模型。该模型基于商汤今年3月自主研发的 NEO-unify 架构，在单一模型框架下实现了多模态理解、推理与生成的深度统一，标志着多模态 AI 范式从“集成式”向“原生统一”的重大跨越。

SenseNova U1所采用的 NEO-unify 架构彻底摒弃了主流模型中常见的拼接式设计，通过去除视觉编码器（VE）与变分自编码器(VAE)，重构了统一的表征空间。这种架构将多模态处理深入融入每一层计算，使语言与视觉信息能够作为统一复合体直接建模，在保留语义丰富度的同时维持了像素级的视觉保真度。依托该技术，模型在逻辑推理与空间智能领域表现显著，能够精准理解物理世界的复杂布局与精细关系。

随着具身智能趋势的演进，商汤科技计划未来将该模型作为机器人的“具身大脑”，在单一模型闭环内完成从环境感知到逻辑推演、再到任务执行的全过程。此次开源行动不仅为行业提供了关键的底层技术引擎，也预示着 AI 模型正向着更高集成度与更强泛化能力的通用架构加速演进。

via AI新闻资讯 (author: AI Base)

2 天前

山东首家百度AI漫剧创作基地正式落户淄博

4 月 27 日，山东省数字文创领域迎来重要进展，省内首个百度AI漫剧创作基地在淄博师范高等专科学校正式揭牌。这一基地的建立，标志着校企合作进入新阶段，旨在通过深度融合AI技术与文创教育，共同探索数字文创人才培养的新范式。

在揭牌仪式上，校方代表强调，该基地将作为学校创新人才培养与深化政校企合作的关键载体。未来，学校计划将真实的项目案例引入课堂，打破传统教学模式，构建起从“作业”到“作品”，再到“产品”与“商品”的全链条项目化教学闭环。此外，通过整合行业优势资源，校方将联合地方政府及企业，共同开展AI文创技术的研发、IP孵化及产业服务，为当地数字文创产业的高质量发展提供人才与技术支撑。

百度方面表示，将为该基地全面开放其自研的AI核心技术、优质IP资源以及专业的创作工具。同时，百度还将提供多元化的分发渠道，确保从创意构思、脚本撰写、内容生成到最终作品发布，每一个环节都能得到全流程的技术支持。这种深度的资源共享模式，旨在培育出更多能够适配行业实战需求的数字文创复合型人才。

揭牌仪式圆满结束后，首期AI漫剧创作培训班随即展开。本次培训采取理论讲解与实际操作相结合的方式，内容设计层层递进。来自百度的相关负责人围绕企业文化、平台运营逻辑及AI漫剧产业布局进行了深度分享，并重点介绍了“成帧”奖等相关创作赛事。合作企业的技术专家也在现场展示了从漫剧脚本设计到AI画面生成，再到后期优化的全流程操作流程，帮助参训学员迅速掌握数字文创的核心实操技能。

via AI新闻资讯 (author: AI Base)

2 天前

AI巨头“敲门”亚洲制造：DeepMind哈萨比斯赴韩，联手三星现代欲将AI“实物化”

谷歌DeepMind首席执行官德米斯·哈萨比斯（Demis Hassabis）于 4 月 27 日正式开启了韩国访问之旅。此次行程行程紧凑且规格极高，哈萨比斯先后与韩国总统及三星电子、LG集团、现代汽车等顶尖企业的最高管理层进行了深度会晤，旨在人工智能（AI）领域挖掘更深层次的战略合作空间。

作为全球AI技术的领军人物，哈萨比斯此行的核心目标在于推动AI技术从云端走向终端。DeepMind正致力于将先进的算法模型植入各类实体设备中，使其真正转化为可感、可用的生产力工具。而韩国企业凭借在半导体、消费电子以及汽车制造等领域的强大工业落地能力，成为了DeepMind眼中理想的共创伙伴。

业界分析认为，此次密集会见释放出了一个强烈的信号：全球顶级AI算力中心正加速与世界一流制造业深度融合。通过哈萨比斯的访问，双方有望在AI芯片研发、智能车载系统以及家电物联网等多个领域达成实际性突破，共同开启AI技术“实物化”的新阶段。

via AI新闻资讯 (author: AI Base)

2 天前

网易有道全面向AI转型：在线营销首成营收支柱，多款AI新品亮相

网易有道近日宣布重大战略调整，正式将其品牌定位从“领先的教育科技公司”更名为“学习与广告AI应用服务提供商”。这一变化标志着公司已将广告业务提升至核心战略地位。据最新数据显示，其 2025 年在线营销服务净收入同比增长达28.5%，历史上首次超越传统业务，成为公司第一大收入来源。

在产品研发层面，网易有道近期密集发布了一系列基于人工智能的硬核产品。其中，专为解决学习难题设计的“AI答疑笔”凭借其技术创新，成功斩获了 2026 年度TheEdTechAwards“教育硬件方案奖”。同时，公司还推出了名为“LobsterAI”的个人助理，以及助力构建智能化知识体系的“有道宝库”AI知识库。此外，旗下的王牌应用“有道翻译官”也迎来了功能升级，新增的耳机同传功能进一步优化了跨语言沟通的即时体验。

除了商业布局与技术迭代，网易有道在社会责任领域也同步发力。通过与国家图书馆基金会合作，公司正式启动了“青少年阅读服务促进计划”公益项目。作为该计划的首批落地举措，网易有道已向基层学校捐赠了 400 支AI词典笔，旨在利用人工智能技术缩小教育资源差距，提升基层青少年的阅读与学习效率。

此次战略重塑不仅反映了网易有道从教育工具向全方位AI应用服务的角色转变，也展现了其在AI商业化落地与社会公益结合上的全新探索。

via AI新闻资讯 (author: AI Base)

2 天前

Snapchat 上线“AI 赞助 Snap”:支持用户与品牌 AI 代理直接对话

Snapchat于2026年4月28日宣布推出其最新广告产品——“AI 赞助 Snap”（AI-powered Sponsored Snaps），标志着该平台正式将生成式 AI 代理集成至核心聊天界面。该功能改变了以往赞助 Snap 无法互动的局限，允许用户直接在应用主聊天标签页内与品牌的 AI 代理进行实时对话。通过这一升级，用户能够针对广告内容进行提问、获取定制化推荐并直接做出购买决策，使营销活动从单向展示进化为双向的互动式服务。

这一战略动作根植于Snapchat极高的用户粘性与 AI 接受度。官方数据显示，截至2026年第一季度，平台用户已发送超过9500亿条聊天信息，其中85% 的用户频繁使用聊天功能。自2023年推出 AI 聊天机器人以来，已有逾5亿用户与其互动，验证了社区对对话式 AI 的高度宽容。从商业成效看，早期赞助 Snap 已能提升22% 的转化率并降低20% 的获客成本。目前，Snapchat拥有近10亿月活跃用户，其高频且私密的对话环境为品牌提供了极具价值的流量池。

行业分析认为，Snapchat此举旨在将广告逻辑由单纯的曝光转向“对话即转化”。在存量竞争时代，利用 AI 代理模拟日常沟通不仅能缓解用户对硬广的抵触感，更能通过个性化互动捕捉精准意图。这种向对话式营销的转型，预示着 AI 正在重新定义社交媒体的变现效率与商业边界。

via AI新闻资讯 (author: AI Base)

2 天前

Google 与五角大楼达成新协议拓展 AI 应用范围

via AI新闻资讯 (author: AI Base)

Telegraph

Google 与五角大楼达成新协议拓展 AI 应用范围

近日，Google 与美国五角大楼签署了一项新协议，向其机密网络开放自家人工智能（AI）工具的访问权限。这一安排是因为另一家 AI 公司 Anthropic 拒绝了五角大楼的敏感用途授权请求。根据新协议，国防部将能够在机密环境中广泛部署 Google 的 AI，用于情报分析和决策支持等多个领域。这一事件的背景源于 Anthropic 对特朗普政府的公开抗议。五角大楼希望在几乎没有限制的情况下使用 Anthropic 的 AI 模型，包括应用于国内监控和自主武器系统，但 Anthropic 坚持要求在合同中添加…

2 天前

中文视觉大模型竞争新局面：豆包夺魁，国产实力全面反超！

SuperCLUE-VLM 发布了最新的中文多模态视觉语言模型测评结果，标志着国内人工智能领域的一次重大突破。在此次评测中，字节跳动的 Doubao-Seed-2.0-Pro-260215 以 90.66 分的优异成绩荣获总榜第一，成功超越了谷歌的 Gemini-3.1-Pro-Preview，后者得分为 89.35 分。

本次测评涵盖了国内外 17 款主流视觉语言模型，国产模型表现出色，不仅在榜单中占据多个前列名次，阿里巴巴的 Qwen3.5 系列、商汤的 SenseNova、以及智谱 GLM 等均表现不俗。相比之下，OpenAI 的 GPT-5.4 和其他一些海外知名模型则只能排在中游位置，显示出国产模型的强劲上升势头。

评测的内容涉及三个主要维度：基础认知、视觉推理和视觉应用，涵盖了多达 25 项具体任务，包括通用识别和医疗影像等。评测结果显示，国产模型在基础认知和数据分析上表现尤为突出，得分普遍超过 90 分，展现了成熟而稳定的能力。然而，在视觉推理及工业、医疗等专业应用领域，国内模型仍然有待进一步提升，某些专业场景的得分相对较低。

划重点：

🌟 Doubao-Seed-2.0-Pro-260215 以 90.66 分获评第一，超越谷歌 Gemini-3.1-Pro-Preview。

📊 国产模型在基础认知和数据分析上得分普遍超过 90 分，表现稳定。

🛠️ 在视觉推理及专业应用领域，国产模型仍需提升，部分场景得分偏低。

via AI新闻资讯 (author: AI Base)

2 天前

Lovable 上线移动端 AI 编码应用，支持语音提示生成 Web 应用

4月28日，初创公司 Lovable 正式在 iOS 和 Android 平台上线其无代码 AI 应用构建器。该产品核心主打“氛围编码（Vibe Coding）”理念，允许潜在开发者随时随地通过语音或文本 AI 提示捕捉灵感，实现移动端的即时开发。用户可在电脑与手机间无缝切换项目进度，并在版本就绪时接收审核通知。

此次发布背景正值苹果公司对“氛围编码”类应用收紧政策。近期，苹果以违反开发者准则、存在安全风险为由，封禁了包括 Replit 和 Vibecode 在内的多款热门工具更新，甚至一度下架同类应用 Anything。监管核心在于禁止应用在宿主内直接下载新代码或改变自身功能。为确保合规，Lovable 采取了将应用预览转移至网页浏览器的策略，定位为生成“可运行的网站或 Web 应用程序”。

在 AI 驱动软件开发的趋势下，Lovable 的入局标志着编程门槛正从专业技术向“灵感驱动”转型。尽管面临应用商店生态的合规性挑战，但 Lovable 通过 Web 端的折中方案，为移动端 AI 原生开发探索出了可行路径。这种从代码编写到预览分发的模式调整，不仅是技术层面的妥协，更是 AI 辅助开发工具在严苛审核机制下寻求生存与增长的行业缩影。

via AI新闻资讯 (author: AI Base)

2 天前

英伟达发布多模态“全能模型”，推理效率达竞品 9 倍

当地时间4月28日，英伟达正式推出其最新的开放式多模态大模型——Nemotron3Nano Omni。这款模型被定位为“全能选手”，通过高度整合视频、音频、图像和文本的深度推理能力，旨在为开发者提供更快速、更智能的交互响应方案。

技术架构上的创新是该模型的一大亮点。Nemotron3Nano Omni采用了30B-A3B的“混合专家”（MoE）架构，将视觉与音频编码器直接集成在系统内部。这种一体化的设计打破了以往多模态处理需要依赖多个独立感知模型的僵局，实现了从“碎片化上下文”向“统一上下文”的跨越。

性能数据表现尤为抢眼。根据官方披露，该模型在复杂文档处理、视频理解及音频感知等六大权威排行榜中均位列榜首。得益于其独特的感知精度，该系统在保持极高交互性的同时，吞吐量达到了同类开放式全向模型的9倍。这意味着企业在部署AI智能体时，能够以更低的成本实现更强的可扩展性，且不牺牲响应的即时性。

目前，已有多家先锋科技公司接入该模型。H Company首席执行官Gautier Cloix在评价该模型时表示，得益于新架构，其AI代理现在可以实时解读全高清屏幕录像，这标志着AI从简单的任务执行者转变为能够实时感知并理解数字环境的交互者。

作为Nemotron3系列（包括Nano、Super和Ultra型号）的重要成员，该系列模型在过去一年中已创下超过5000万次的下载记录。英伟达表示，Nemotron3Nano Omni不仅可以独立运行，还能与专有云模型或其他开源模型协同工作，为复杂的代理工作流提供底座支持。此次发布无疑为企业级AI智能体的生产与部署树立了全新的效率标杆。

via AI新闻资讯 (author: AI Base)

2 天前

苹果iOS27 细节曝光：三大AI修图神器助攻，支持画幅“脑补”

备受瞩目的WWDC26 全球开发者大会定于 6 月 8 日开幕。据最新消息透露，苹果届时将发布全新的iOS27 系统，其核心亮点在于深度集成三项突破性的AI照片编辑功能，力求在数秒内重构图像。

在新版照片应用中，苹果将推出名为“Apple Intelligence Tools”的专属菜单。其中最受关注的当属“Extend”功能，它能够利用生成式AI技术，自动填充照片边缘之外的背景内容。

智慧功能重塑影像

除了能“脑补”画面的扩展工具，系统还内置了“Enhance”增强功能。该工具可以精准识别并优化图像质量，智能调节照片的光影平衡与色彩饱和度。

针对空间影像，苹果还开发了“Reframe”重构工具。用户在后期编辑时可以自由切换观看视角，这一功能将极大地提升空间照片的沉浸感与视觉冲击力。

测试阶段仍存挑战

尽管功能构想极具吸引力，但目前的开发进程似乎并非一帆风顺。内部测试数据显示，由于底层模型尚在打磨，画幅扩展与视角重构的稳定性仍有待提升。

苹果团队目前正全力优化算法，以确保最终交付的用户体验符合标准。如果技术表现未达预期，部分前沿功能可能会推迟发布，或在初期采取小规模试运行的策略。

via AI新闻资讯 (author: AI Base)

2 天前

AI 浏览器 Comet 正式上线 iPad，全面支持多任务处理

近日，Perplexity 旗下的 AI 浏览器 Comet 宣布其 iPad 版本正式上线，并全面适配苹果 iPadOS 系统。这一新版本不仅支持多窗口浏览和多任务处理功能，还深度整合了 OpenAI 与 Anthropic 等主流 AI 模型，为用户提供更为智能的上网体验。

Comet 浏览器的推出，不仅丰富了用户的网页浏览方式，还大幅提升了用户与 AI 聊天机器人的互动。通过这一浏览器，用户可以轻松调用 OpenAI、Anthropic 等顶尖 AI 模型，进行智能搜索和交互。对于习惯于多任务处理的 iPad 用户来说，这一更新无疑是一个重大利好。

在 iPadOS 的多任务处理机制下，Comet 浏览器支持用户同时开启多个浏览窗口，提升工作效率。无论是进行文档查阅，还是在线学习，用户都能轻松在不同窗口间切换，享受流畅的操作体验。这一功能的推出，标志着 Perplexity 在不断扩大其在苹果生态中的布局。

值得一提的是，Comet 浏览器并非首次进入苹果平台。今年 3 月，Perplexity 已在 iPhone 平台上线该浏览器，并在 Mac 平台推出了一项名为 “Personal Computer” 的智能助手功能，进一步增强了桌面端的 AI 能力。可以预见，Perplexity 正致力于将 AI 技术融入更多日常工具中，推动用户体验的提升。

随着 Comet 浏览器的发布，Perplexity 在移动端和桌面端的持续努力，展示了其在 AI 浏览器领域的强大潜力和创新能力。未来，用户将能够期待更多智能功能的推出，进一步提升上网的便捷性与智能化。

via AI新闻资讯 (author: AI Base)

2 天前

Claude深度集成Adobe、Blender等八大神器，AI代画代练时代开启？

创意领域的工作流正迎来一场效率革命。Anthropic 近日正式宣布，旗下人工智能模型 Claude 已实现与 Adobe、Blender 等八大主流创意软件的深度互联。通过新增的专属连接器（Connectors），Claude 的 AI 能力将不再局限于独立的聊天窗口，而是直接融入平面设计、3D 建模及音频制作的专业生产流程中。

在视觉创作领域，Claude 与 Adobe 生态的整合尤为引人注目。创作者现在可以直接在常用的工具中调用包括 Photoshop、Premiere 和 Express 在内的 50 多项核心功能。与此同时，针对 Affinity 的连接器则侧重于生产力的自动化，能够接管那些枯燥、重复的生产任务，甚至支持用户根据具体需求定制专属的自动化功能。

3D 建模与工业设计同样受益匪浅。Autodesk Fusion 的订阅用户如今只需通过简单的自然语言对话，即可指挥 AI 完成复杂工业模型的构建与修改。而 SketchUp 的使用者可以先向 Claude 描述初步构思，由 AI 快速搭建基础 3D 雏形后，再进入软件进行精细化打磨。

值得一提的是，开源 3D 软件 Blender 的集成利用了 Python API。这意味着开发者和动画师不仅能让 AI 协助分析并调试复杂的 3D 场景，还能批量编写自定义脚本来操作对象。对于视觉艺术家而言，现在甚至可以用自然语言实时操控 Resolume Arena 和 Wire 等舞台视觉软件。

在音频领域，此次更新同样覆盖了 Ableton 和 Splice。音乐制作人可以随时向 Claude 查询复杂的官方文档，或者在海量的免版税采样库中进行快速检索。

此次升级标志着 Claude 的角色定位发生了转变：它不再仅仅是一个简单的对话机器人，而是进化成了能够理解专业软件逻辑、编写插件、重构数据格式的“智能助手”。通过接管繁琐的执行层面工作，AI 旨在让创作者将更多精力回归到核心灵感的打磨上。

via AI新闻资讯 (author: AI Base)

2 天前

国产AI视觉大模型集体“反超”，豆包力压谷歌拿下全球第一

根据SuperCLUE-VLM发布的2026年4月最新评测报告，中文多模态视觉语言模型领域发生了结构性变动。在对全球17款主流大模型进行的深度横评中，国产AI阵营表现出极强的爆发力，不仅在中文语境理解上优势明显，综合得分也实现了对海外顶尖模型的反超。

字节跳动登顶榜首，多款国产模型跻身第一梯队

测评结果显示，字节跳动旗下的Doubao-Seed-2.0-Pro-260215以90.66的高分荣登总榜冠军。这一成绩成功超越了此前备受关注的谷歌Gemini-3.1-Pro-Preview（89.35分）。与此同时，阿里旗下的Qwen3.5系列、商汤SenseNova以及智谱GLM等国产模型同样表现不俗，稳居榜单前列。相比之下，OpenAI的GPT-5.4及X.AI的Grok等海外知名模型在本次中文多模态测试中仅位列中游。

三大维度深度解构，基础认知能力表现成熟

本次评测体系严密，从基础认知、视觉推理、视觉应用三大核心维度展开，细分任务涵盖了通用识别、图表分析、医疗影像等25项具体场景。国产模型在“基础认知”与“数据分析”两个领域表现尤为出色，得分普遍跨越90分大关，显示出极高的技术成熟度与中文环境适配性。

垂直领域仍存挑战，工业与医疗推理成未来赛点

尽管在综合排名上实现领先，但测评数据也揭示了国产模型仍需完善的方向。在涉及工业检测、高精度医疗影像等专业性极强的“视觉推理”任务中，国内模型与全球顶尖水平相比仍有进步空间，部分细分场景的得分波动较大。

业内分析认为，本次榜单的更迭标志着中文多模态AI已经跨越了关键的技术拐点。国产大模型在中文场景的深度理解与应用能力上，已经建立起了坚实的竞争壁垒，正式开启了与国际巨头并驾齐驱甚至局部领先的新阶段。

via AI新闻资讯 (author: AI Base)

2 天前

转头牵手亚马逊？AWS 迅速接入OpenAI全系产品

全球 AI 版图迎来了一次重磅震荡。就在 OpenAI 宣布其长期盟友兼最大投资方——微软，不再拥有其产品的“云端独家使用权”后，科技巨头亚马逊（Amazon）展现出了极为敏锐的反应速度。

这一举动意味着，长期以来将 OpenAI 模型作为核心竞争力的微软 Azure 平台，正式失去了其在云服务市场的差异化特权。

闪电上架：AWS 迅速接入 OpenAI 全系产品

市场观察显示，这一规则的改变迅速引发了连锁反应。在 OpenAI 与微软公布修订后的合作协议后不久，亚马逊首席执行官安迪·贾西（Andy Jassy）便在社交媒体上公开表态，称其为一则“耐人寻味的公告”。

随后，亚马逊云科技（AWS）迅速行动，扫清了此前的合作技术与法律障碍，正式在其平台上架了 OpenAI 的全系产品。这一动作的效率之快，超出了不少行业分析师的预期，也标志着 AWS 用户现在可以像使用其他大模型一样，直接调用 OpenAI 的尖端生成式 AI 能力。

资本博弈：500 亿美元合作背后的权力重组

事实上，这次“倒戈”早有预兆。此前，OpenAI 已与亚马逊达成了最高达 500 亿美元的合作框架协议。在如此巨额的注资背景下，双方在产品权限上的博弈日益公开化。

过去，OpenAI 与微软的深度捆绑虽然带来了稳定的算力支持，但也限制了其在其他云平台上的商业扩张。如今，随着协议的修订，OpenAI 成功实现了“多云布局”，在保持与微软合作的同时，充分挖掘 AWS 庞大的企业客户资源。

行业影响：AI 算力竞赛进入“大混战”

对于开发者和企业用户而言，这无疑是一个巨大的利好。OpenAI 产品进入 AWS 阵营，意味着企业无需为了使用特定模型而迁移整个云架构。

分析人士指出，随着亚马逊的强势切入，云服务巨头之间的竞争将从早期的“独家版权赛”转向“综合服务赛”。对于 OpenAI 而言，通过平衡微软与亚马逊两大巨头的关系，不仅获得了更灵活的资金和算力支持，更在 AI 基础设施领域掌握了更强的话语权。

via AI新闻资讯 (author: AI Base)

2 天前

Horizon Summary: 2026-04-29 (ZH)

via Horizon Daily - 中文摘要

Horizon Daily

Horizon Summary: 2026-04-29 (ZH)

From 55 items, 31 important content pieces were selected

Before

After

Home