https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
马斯克曾考虑让奥尔特曼加入特斯拉董事会

马斯克与奥尔特曼之间的法庭大战进入第二周。周三,陪审团被告知,马斯克曾一度考虑邀请奥尔特曼加入特斯拉公司董事会。马斯克的亲信、曾担任OpenAI董事会成员的希冯·齐里斯周三作证称,“曾有一段时间确实有过这个打算”,大约在2017年底。“您是否记得,马斯克曾经提出或讨论过,要给奥尔特曼在特斯拉安排一个董事会席位?”OpenAI的律师萨拉·埃迪在庭上这样问齐里斯。齐里斯说:“我记得。” 但她补充说自己记不清具体的时间了。OpenAI的另一位律师威廉·萨维特在法院外告诉记者,有 “书面证据” 显示,马斯克曾试图让奥尔特曼加入董事会,意在“收编OpenAI,并将其吸纳进特斯拉”。

—— 凤凰网科技彭博社

via 风向旗参考快讯 - Telegram Channel
月之暗面 Kimi 再融资 20 亿美元,估值突破 200 亿美元

据“晚点LatePost”消息,月之暗面 Kimi 近日宣布完成一轮约 20 亿美元的融资,此轮融资的投后估值已突破 200 亿美元。此次融资由美团龙珠领投,中国移动及中信产业基金等多家机构参与,龙珠的出资额超过 2 亿美元。

自今年初以来,月之暗面已连续完成三轮融资,累计金额达到 19 亿美元,加上此次融资,公司在不到半年的时间内,总融资额超过 39 亿美元,折合人民币约 376 亿元,成为国内大模型创业公司中的佼佼者。

根据财务数据,月之暗面 Kimi 的年度经常性收入在 3 月初已突破 1 亿美元,到了 4 月,这一数字进一步增长至超过 2 亿美元,显示出其付费订阅和 API 调用的显著增长。

在技术方面,月之暗面近期发布并开源了 Kimi K2.6 模型。此模型在代码编写、长程任务执行以及 Agent 集群能力方面都有了全面升级。Kimi K2.6 能够支持多达 300 个子 Agent 并行运行,执行约 4000 个协作步骤,完成从文档到网页、PPT 和表格等多种产品的端到端交付。

此外,Kimi K2.6 在多项权威基准测试中的成绩已达行业领先水平,性能表现不亚于 GPT-5.4、Claude Opus 4.6 和 Gemini 3.1 Pro 等主流闭源模型。值得一提的是,Kimi K2.6 还可以持续编码 13 小时,编写或修改超过 4000 行代码,为复杂系统的开发和优化提供了强大的支持。 

划重点:

🌟 月之暗面 Kimi 完成 20 亿美元融资,估值超过 200 亿美元。

📈 年度经常性收入在短时间内实现突破,显示出强劲的增长势头。

🤖 Kimi K2.6 模型技术升级,支持多 Agent 协作,性能媲美行业领先模型。



via AI新闻资讯 (author: AI Base)
谷歌AI战略再“变阵”:网页代理项目Project Mariner正式谢幕

在生成式AI迈向“自动化执行”的关键阶段,科技巨头谷歌正在加速内部技术栈的整合。最新消息显示,谷歌已于5月4日宣布停运其实验性网页自动化项目Project Mariner。虽然该独立项目告一段落,但其积累的核心技术并未被封存,而是被全面整合进Gemini Agent及AI Mode等核心产品矩阵中。

作为谷歌在AI代理领域的重要尝试,Project Mariner自2024年底亮相以来,便以“代替用户操作”为核心卖点。它能够理解复杂的跨网页指令,并自主执行多步骤任务。在最近的技术迭代中,该项目已经展现出同时高效处理10项并发任务的强大能力,为网页代理工具树立了技术标杆。

此次停运更像是一次“转场”。过去一年里,谷歌一直致力于将Mariner的自动化基因缝合进自家的生态闭环。紧随其后,Chrome浏览器展示了全新的AI功能“auto-browse”,该功能同样主打多步骤任务的自动化执行。

业内分析认为,这一系列动作是谷歌对市场上竞品网页代理工具的直接回应。通过将零散的实验项目转化为核心产品的内置能力,谷歌正试图在AI代理(AI Agent)的竞争中,利用其庞大的用户基数和浏览器生态建立起更稳固的护城河。

via AI新闻资讯 (author: AI Base)
阿里大模型加速“入世”:千问数字人亮相,核心生态全面打通

随着人工智能竞速进入应用层爆发期,阿里巴巴在AI生态融合上迈出了关键一步。 4 月 22 日,阿里正式发布了统一的AI数字人形象“千问小酒窝”,这不仅标志着通义千问有了更具辨识度的品牌人格,更预示着其背后AI技术在商业化落地上的全面提速。

目前的动作显示,阿里巴巴正加速将千问AI助手深度接入其核心生态矩阵。从国民级的购物平台淘宝,到出行必备的高德地图,AI助手的身影正在变得无处不在。这种深度的系统级集成,旨在通过智能化交互提升用户体验,同时也极大增强了市场对其AI商业变现能力的信心。

这种生态协同效应也引起了全球资本市场的关注。高盛、瑞银等知名国际投行在近期发布的策略报告中,纷纷表达了对中国资产的看好。分析指出,港股科技板块有望在AI技术的持续催化下迎来估值重塑,而像阿里这样拥有完整生态链的龙头科技公司,其市场关注度正在显著回升。

从技术研发到场景落地,阿里巴巴通过“千问小酒窝”这一形象切口,展示了其将AI能力转化为实际生产力的决心。在AI商业化下半场的博弈中,能否让大模型在核心业务中产生实际价值,已成为衡量科技巨头竞争力的核心指标。

via AI新闻资讯 (author: AI Base)
职场人福音:法律大模型走进现实,合同“智理”不再是难事

2026 年以来,人工智能在法律领域的应用正加速从实验室走向生产线,标志着“AI合同量产时代”的正式开启。尽管技术日趋成熟,但数据安全与专业信任度依然是行业难以逾越的门槛。对于众多身处一线的业务团队而言,合同撰写难、审查慢、管理乱等痛点长期存在,严重制约了企业的流转效率。

针对这些实际困境,国内领先的电子签名与法律科技服务商法大大近日正式发布了“智能合同助手”。该产品依托其在法律垂直领域深耕多年的AI技术积淀,成功构建了从法律咨询、草拟起草、专业审查到电子签署及自动化归档的全链路服务闭环。

值得关注的是,这款助手将原本服务于大型政企客户的同源“AI合规中台”能力进行了轻量化改造,以几乎“零门槛”的形态向普通用户开放。这意味着,即使是缺乏专业法务支持的小微企业或个人,也能享受到专业级的合规保障。

为了适配高频的移动办公需求,智能合同助手摒弃了复杂的客户端安装流程。用户只需通过微信小程序即可随开随用,这种便捷的交互模式不仅大幅降低了工具的使用门槛,更能在日常业务场景中实时规避法律风险,助力合同流转进入“快车道”。

via AI新闻资讯 (author: AI Base)
AI巨头交出亮眼成绩单!美图公司付费用户数刷新纪录,生产力工具成增长新引擎

美图公司于 5 月 6 日正式对外披露了 2026 年第一季度的业务数据。报告显示,得益于AI应用的商业化进程全面提速,公司的多项核心业务指标均实现显著增长。其中,付费订阅用户数表现尤为抢眼,已攀升至 1790 万的历史新高,显示出用户对高价值数字化内容与工具的强劲需求。

在财务表现方面,美图以付费订阅为核心的影像与设计产品业务收入达到8. 52 亿元,较去年同期大幅增长34.3%。从收入结构来看,尽管生活场景应用仍占据82%的绝对份额,但面向专业领域的生产力应用正展现出巨大的增长潜力,贡献了约18%的收入。

值得关注的是,美图在生产力赛道的布局已进入收获期。截至 2026 年 3 月,公司旗下AI生产力应用的年度经常性收入(ARR)已接近5. 8 亿元,同比增速高达56.2%。这种高速增长的背后是用户活跃度与技术使用深度的双重提升——数据显示,仅在今年 3 月,影像与设计产品所消耗的AI算力点金额,就比 2025 年 12 月激增了59%。

分析指出,算力消耗的爆发式增长不仅反映了AI功能的普及程度,也预示着美图在从“大众美化工具”向“专业生产力平台”转型的道路上取得了实质性突破。随着AI算法的持续迭代与应用场景的深度拓展,美图的商业化版图有望在未来进一步扩张。

via AI新闻资讯 (author: AI Base)
AI让“随性派”说走就走:五一长假见证智能旅游决策爆发式增长

近日,飞猪联合小红书发布《“五一”出行趋势报告》,揭示了人工智能技术在旅游决策场景中的渗透率正显著提升。数据显示,今年“五一”假期期间,飞猪平台AI咨询量在清明假期的高基础上继续攀升,环比增长达56%。“来自AI的建议”已打破传统的攻略模式,成为驱动游客出行决策的关键变量,标志着旅游业正从“搜索时代”向“智能助手时代”跨越。

报告指出,当前旅游市场需求呈现高度分化态势,用户愈发依赖兴趣驱动与个性化体验。在“出片党”、“吃货”、“运动控”、“慢游族”及“随性派”五类典型人群中,以即兴出发、不做攻略为特征的“随性派”与AI工具的契合度最高。对于追求惊喜感的游客而言,AI显著降低了灵活出行的规划门槛,使“说走就走”的即时需求得以精准满足。与此同时,旅拍供给在湖州、舟山、重庆等地翻倍增长,美食与户外运动搜索热度持续高涨,进一步印证了旅游偏好的多元化。

从行业视角看,AI咨询量的爆发式增长不仅是交互方式的改变,更是大模型技术在垂直领域落地深化的体现。当AI建议开始左右目的地选择与消费链路,旅游平台的竞争重心已由资源整合转向算法驱动的决策效率提升。这种技术赋能有望重塑文旅产业的供需关系,推动行业向更加灵活、智能且高频的体验式消费转型。

via AI新闻资讯 (author: AI Base)
微软面临清洁能源承诺挑战:AI 数据中心扩张或将影响目标实现

随着微软在全球范围内快速扩展 AI 数据中心,这家科技巨头正在内部讨论是否推迟或缩减其清洁能源目标。根据彭博社的报道,微软的 “按小时匹配清洁能源” 目标,作为业内最激进的减排承诺之一,可能面临重新评估。该目标旨在到 2030 年实现公司用电需求的 100% 由清洁电力按小时匹配。

然而,随着 AI 算力需求激增和数据中心的快速增长,微软高层开始认为,这一承诺可能成为业务扩张 “束缚”。目前,微软尚未就此作出公开声明,发言人表示公司仍将寻找机会,维持年度清洁电力匹配目标。

与年度匹配相比,按小时匹配被认为更为严格,能够更真实地反映减排效果。它要求电力系统在接近实时的基础上维持供需平衡,而不仅仅是在账面上实现年度对冲。一些批评者认为,当前企业广泛采用的年度目标存在 “会计技巧” 的嫌疑,可能并不足以实现真正的减排目标。

微软在减排方面的努力向来引人注目,早在今年早些时候,公司就宣布已实现年度排放抵消,并继续推进净零路径。然而,随着数据中心的不断扩大,微软在实际用能上却越来越依赖天然气发电作为补充。最近,微软宣布与雪佛龙及投资机构合作,在得克萨斯州建设一座大型天然气电厂,以支持其数据中心的运行。

尽管如此,微软依然被视为科技行业在净零目标上的领跑者。公司计划到 2030 年实现 “碳负排放”,即从大气中移除的二氧化碳总量将超过其运营排放。支撑这一目标的手段之一是微软内部实施的 “碳税” 机制。

随着数据中心建设的推进,当地民众和社区对微软的反对声逐渐增加,主要关注点在于污染排放和用水压力等问题。如果微软减弱按小时匹配的承诺,这可能影响其说服当地政府和民众的能力,增加新项目的社会阻力。

当前,微软的选择反映出大型科技行业的矛盾:在追求道德与治理的高地的同时,巨大的电力需求又将它们推向依赖天然气等化石燃料的方向。微软内部围绕按小时匹配目标的争论,或将成为观察科技巨头如何在 AI 扩张与气候承诺之间重新划线的关键。

划重点:

🌱 微软正在考虑推迟或缩减其清洁能源目标,以应对 AI 数据中心的扩张需求。

⚡️ 按小时匹配清洁能源目标被视为更严格的减排标准,但可能成为公司业务扩张的限制。

🌍 当地民众对新数据中心的反对声上升,微软面临在 AI 发展与环境承诺之间的平衡挑战。


via AI新闻资讯 (author: AI Base)
谷歌停运 Project Mariner,核心技术融入 AI 模式

谷歌公司正式宣布停运其实验性网页自动化项目 ——Project Mariner。尽管该项目已停止运营,但其所采用的技术并未被淘汰,而是被整合到谷歌的其他核心产品中,如 Gemini Agent 和 AI Mode 等。

Project Mariner 最早在 2024 年 12 月首次亮相,主要用于代替用户执行跨网页的多步骤任务,包括信息检索和操作。经过多次迭代,该项目已经发展到能够同时处理十个任务,展现出强大的多任务并发处理能力。谷歌在过去一年中逐步将 Project Mariner 的核心功能融入到自家产品生态系统中,以提升其智能化水平。

特别是其智能体能力已被整合到 Gemini Agent 中,能够代为处理例如归档邮件和预订酒店等任务。此外,这些功能也被引入到谷歌的搜索产品 AI Mode 中,以增强搜索体验。

在这一背景下,谷歌在今年早些时候推出了 Chrome 浏览器的新 AI 功能 “auto-browse”。该功能可以执行多步骤任务,比如查询航班价格,旨在与 OpenAI 和 Perplexity 等竞争对手的网页代理工具形成直接竞争。  

划重点:

🌐 谷歌宣布停运 Project Mariner,但技术已整合至 Gemini Agent 和 AI Mode。

🤖 Project Mariner 具备同时处理十个任务的能力,增强了多任务处理能力。

✈️ 新推出的 “auto-browse” 功能可执行多步骤任务,如查询航班价格。



via AI新闻资讯 (author: AI Base)
谷歌更新AI搜索功能:集成Reddit与社交媒体一手观点

谷歌近日对其生成式AI搜索功能(SGE/AI Overviews)进行重大升级,旨在通过整合社交媒体、论坛及新闻订阅等一手信息源,优化用户获取信任资讯的效率。此次更新最显著的变化在于引入“观点预览”功能,将Reddit、各类网络论坛的真实在线对话与用户查询直接关联。谷歌官方指出,此举顺应了用户日益倾向于寻求真实经验而非过度SEO优化内容的趋势,回应了社交平台正逐渐成为信息检索关键节点的行业现状。

在技术实现上,谷歌不仅在AI回复中嵌入来自专业论坛的“专家建议”,还新增了创作者名称、社区昵称等上下文标识,帮助用户快速判别信源可靠性。为深化探索维度,AI搜索结果旁现已支持展示相关主题的延伸链接,例如在检索北极光摄影技术时,系统将精准导流至摄影论坛的具体曝光建议。

此外,针对城市规划或旅游指南等复杂查询,谷歌在AI摘要末尾增设了建议主题,涵盖案例研究与博客报告,鼓励用户从单一搜索向深度研究转变。

值得关注的是,谷歌同步推出了针对新闻出版商的订阅链接突出显示功能,确保用户在AI模式下能优先访问已订阅的权威信息流。这一系列战略动作表明,谷歌正试图通过重构信源优先级,挽留流向垂直社交媒体的搜索流量。通过将碎片化的社区智慧与权威出版物整合进AI架构,谷歌不仅提升了AI回复的颗粒度,也标志着搜索引擎正从单纯的“信息索引器”向“信赖知识枢纽”加速演进。

via AI新闻资讯 (author: AI Base)
谷歌 Chrome 浏览器被曝静默下载 4GB AI 模型,清理后仍会自动重启下载

近日,全球市场占有率最高的浏览器 Google Chrome 被爆出在用户不知情的情况下,向符合条件的设备静默推送并下载了容量高达4GB 的 Gemini Nano 模型。更令不少用户感到困扰的是,即便手动删除了相关文件,浏览器仍会在后台悄悄重新下载,这种“强制入驻”的行为引发了技术社区的广泛关注。

据了解,Gemini Nano 是谷歌专门为本地设备设计的轻量化大模型,主要支撑其备受争议的 Prompt API 功能。然而,这款所谓的“轻量级”模型对硬件有着明确的门槛。设备需要拥有至少16GB 的内存和4GB 的显存,同时在浏览器安装目录所在分区预留不少于22GB 的可用空间。

目前 Chrome 在全球拥有约38亿用户,其中符合上述硬件要求的设备基数极其庞大。业内人士分析指出,即便不考虑反复下载带来的流量损耗,仅针对数以亿计的设备静默推送4GB 的数据,也是一场惊人的网络资源与存储空间浪费。

一个显著的对比是,Chrome 浏览器本身的安装包大小仅为1GB 左右。而这个悄然潜入的 AI 模型体积竟是软件本体的四倍,这显然超出了绝大多数用户对“功能更新”或“插件增强”的心理预期。

技术爱好者发现,这些模型文件被存放在一个名为“OptGuideOnDeviceModel”的文件夹内,其命名对应的是“设备端优化指南模型存储”。尽管谷歌致力于推动 AI 本地化以提升处理效率和隐私保护,但这种缺乏告知且难以彻底关闭的推送机制,无疑让用户在硬盘空间和自主控制权之间感受到了压力。

via AI新闻资讯 (author: AI Base)
昔日伙伴对簿公堂:OpenAI 总裁日记成庭审关键,揭秘与马斯克的分裂始末

在 OpenAI 与埃隆·马斯克(Elon Musk)旷日持久的法律纠纷中,OpenAI 总裁格雷格·布罗克曼(Greg Brockman)的个人私密日记意外成为了法庭辩论的核心。近日,布罗克曼在庭审现场被迫公开宣读其多年来的日记摘要。马斯克方的法律团队试图通过这些文字,证明 OpenAI 的高层早已背离了最初的“非营利”使命,转而追求巨额个人财富。

布罗克曼在庭审中表现得十分痛苦,他强调这些日记只是他个人的“意识流”记录,包含了对他人的观察以及对各种决策的反复权衡,并非确凿的行为指南。然而,日记中关于“转为营利性模式听起来很不错”、“财务上如何能赚到 10 亿美元”等字眼,无疑成为了控方最有力的攻击点。

10 亿美元与 300 亿美元的数字鸿沟

庭审的焦点之一在于布罗克曼在公司转型中的收益。马斯克的律师指出,布罗克曼曾在日记中写下“10 亿美元”的职业财富目标,而如今他在 OpenAI 的股份价值已飙升至约 300 亿美元。面对“是否愿意向非营利部门退还 290 亿美元”的质问,布罗克曼予以明确拒绝,并辩称这些股份是在 ChatGPT 爆发式增长前获得的,且他为建立这个全球资金最充足的非营利组织付出了巨大努力。

管理权之争:谁才是那个“独裁者”?

除了金钱博弈,日记还揭示了 OpenAI 早期对于马斯克控制权的恐惧。布罗克曼在记录中提到,马斯克曾给出最后通牒:要么让他获得营利部门的绝对控制权,要么公司维持非营利现状。布罗克曼担心马斯克会成为所谓的“通用人工智能(AGI)独裁者”,从而危害公司使命。这种不安全感最终促使他选择支持萨姆·奥特曼(Sam Altman),并在马斯克于 2018 年离开董事会后,主导了公司的结构转型。

安全与理想的幻灭

布罗克曼在证词中对马斯克的专业性提出了质疑,声称马斯克虽然在火箭和电动汽车领域是专家,但对 AI 的认知有限,其严厉的批评甚至险些让核心工程师转行。更具杀伤力的指控是,布罗克曼称马斯克在离职演说中曾暗示,为了在竞赛中赶超谷歌,特斯拉在研发 AGI 时可能会为了效率而牺牲安全标准。

目前,这场庭审仍在继续。布罗克曼努力将自己塑造为一个为了保护技术初衷而不得不做出艰难抉择的理想主义者,而马斯克一方则致力于证明这是一场精心策划的“慈善劫案”。日记中的文字究竟是深思熟虑的贪婪,还是纠结中的自我辩护,仍有待陪审团给出最终答案。

via AI新闻资讯 (author: AI Base)
字节跳动发布全模态大模型Doubao-Seed-2.0-lite,AI能听会看还能直接“上手”干活

字节跳动旗下火山引擎于5月6日宣布,豆包大模型家族正式迎来首款全模态理解模型——Doubao-Seed-2.0-lite。作为该系列的重磅升级版本,新模型彻底打破了单一模态的限制,实现了视频、图像、音频与文本的原生统一理解,标志着其在多模态交互领域迈出了关键一步。

该模型在视觉与逻辑推理能力上表现尤为亮眼。在物理、医疗等高阶学科的复杂推理测试中,其性能已大幅超越今年2月发布的Pro版本。而在细粒度感知以及具身理解等前沿领域,该模型更是达到了行业领先水平。通过融入语音理解技术,Doubao-Seed-2.0-lite 能够实现“音画同步”的深度联合推理。这意味着它不仅能“看懂”视频画面,还能结合背景音频精准判断视频内容的视听一致性,甚至能根据指令在长视频中精准定位特定事件,并还原复杂的人物关系脉络。

在音频处理层面,新模型展现了极高的翻译与感知精度,支持包括中英在内的19种语种转写及14个语种的互译。除了精准的语义识别,它还能敏锐捕捉语音中的情绪波动及环境背景声,使其理解能力更接近人类的自然认知。

值得关注的是,Doubao-Seed-2.0-lite 的 Agent(智能体)与 Coding(编程)能力也同步完成了进化。模型对多轮复杂指令的遵循度显著提升,具备了更强的自我拆解与校验能力。在开发领域,它的代码能力已覆盖前端页面、3D场景及游戏开发,能够交付视觉美观且工程完整的产物。

此外,该模型首次实现了GUI(图形用户界面)理解与执行的一体化。它不仅能识别网页或应用中的按钮、菜单等元素,还能像真人一样完成点击、拖拽、输入等操作,真正实现了从“读懂界面”到“端到端交付任务”的闭环。

目前,这一技术已在电竞复盘、在线教育及跨境电商等多个领域落地。例如在电竞场景中,AI可以作为教练,连续分析长达25小时的比赛视频与语音,自动生成战术复盘图谱。与此同时,更高效的 Doubao-Seed-2.0-mini 版本也已同步上线,为企业大规模、低成本部署全模态推理任务提供了更具性价比的选择。

via AI新闻资讯 (author: AI Base)
马斯克宣布解散 xAI,重组为 SpaceXAI

埃隆・马斯克通过 X 平台透露,旗下的人工智能公司 xAI 将被解散,并重新命名为 SpaceXAI,专注于 SpaceX 的人工智能产品。这一变动意味着 xAI 将不再作为独立公司运作,而是融入到 SpaceX 的整体战略中。

据了解,早在今年2月,SpaceX 曾宣布收购 xAI,这一举措旨在将人工智能与航天技术相结合,推动在太空中部署数据中心的目标。马斯克对此表示,合并后的公司将致力于开发一个整合人工智能、运载火箭、天基互联网等技术的综合平台,从而实现更高效的信息处理与通讯服务。

与此同时,SpaceX 与人工智能公司 Anthropic 也签署了合作协议,允许 Anthropic 使用 SpaceX Colossus1数据中心的强大算力。此举意味着 Anthropic 将获得超过22万颗英伟达 GPU 的计算能力,用于开发高效的 AI 解决方案。此外,Anthropic 表示对合作开发轨道 AI 算力也表现出了浓厚的兴趣。

马斯克的这一系列举措显示出他对人工智能在航天及其他领域的重视,期待通过技术创新推动行业的发展。随着 SpaceXAI 的成立,未来在太空和地球之间的信息交流和处理能力将会得到进一步提升。

划重点:

🌌 马斯克宣布将 xAI 解散,更名为 SpaceXAI,专注于 SpaceX 的 AI 产品。

🚀 SpaceX 与 Anthropic 达成合作协议,共享 Colossus1数据中心的算力。

💻 合并后,公司将整合 AI 与航天技术,推动数据中心在太空的部署目标。


via AI新闻资讯 (author: AI Base)
Adobe Acrobat 推出 PDF Spaces:让静态文档变身智能互动工作空间

Adobe 于 5 月 6 日宣布在其 Acrobat 产品中推出一项全新功能 ——PDF Spaces。这一创新功能旨在将传统的静态 PDF 文档和其他格式的文件转化为富有互动性的 AI 工作空间,让用户能够以全新的方式分享和利用信息。

PDF Spaces 允许用户将 PDF 文档、链接、笔记等多种内容整合在一起,并通过 AI 技术生成摘要、演示文稿等内容。这意味着,过去枯燥无味的静态文档如今能够转变为可互动、可定制的动态体验,为用户带来全新的信息处理方式。

使用 PDF Spaces 时,用户只需上传需要分享的 PDF、文档或链接,AI 助手就能够根据用户需求生成内容结构,并自动创建包括音频概览和品牌演示文稿在内的多种输出形式。用户在创建定制空间后,还可以添加多媒体元素,调整内容的重点。接收者通过与定制的 AI 助手对话,能够轻松获取所需信息,从而在决策时更加高效。此外,系统自动生成的音频摘要也能帮助接收者迅速找到关键信息,省去大量阅读时间。

这一功能适用于多种场景,包括销售提案、市场营销及人力资源管理等。例如,销售人员可以上传产品资料,通过 AI 优化后生成包含产品详情和利润分析的互动体验。客户无需再翻阅冗长的文档,直接与 AI 对话就能深入了解相关信息。同时,个人用户也可以利用此功能整理旅行计划或活动详情,实现更智能化的信息管理。

Adobe Document Cloud 的高级副总裁 Abhigyan Modi 表示,PDF Spaces 不仅是传统功能的叠加,而是引入了一种全新的内容展示格式。目前,这一功能已在 Acrobat Express 和 Acrobat Studio 中上线,用户可以体验到这一便捷的智能工具。

划重点:

📝 Adobe 推出 PDF Spaces 功能,将静态文档转化为互动 AI 工作空间。

🤖 用户可通过 AI 助手生成摘要和演示文稿,提升信息处理效率。

📊 此功能广泛适用于销售、市场营销和个人信息管理等场景。


via AI新闻资讯 (author: AI Base)
TikTok 撤回视频摘要 AI 功能:因频繁出现“蓝莓”等严重幻觉

TikTok 近期宣布停止测试一项旨在为视频自动生成文字摘要的实验性人工智能功能,并将该工具的研发重心转向特定领域。这项已在美国等市场小范围测试数月的“人工智能概览(AI Overviews)”功能,原计划利用 TikTok 自研或第三方多模态模型为用户提供视频背景信息及产品推荐。

然而,在实际应用中,该功能展现出的严重“幻觉”引发了广泛关注:其将头部创作者 Charli D'Amelio 的出镜视频识别为“配料不同的蓝莓集合”,将训狗教程误读为“折纸艺术”,甚至将夏奇拉的宣传短片描述为“移动的蓝色形状”。

面对算法理解能力的显著偏差,TikTok 发言人证实已根据反馈暂停相关测试,并明确未来该功能将聚焦于识别视频中的具体产品,而非尝试概览复杂的视频全文。这一动作反映出当前生成式 AI 在处理动态视觉信息时,依然面临逻辑关联断裂与语义识别错误的技术瓶颈。

此次事件被行业视为继谷歌“胶水披萨”后的又一典型 AI 幻觉案例。尽管近期数据表明谷歌等大厂的 AI 概览准确率已有所提升,但 TikTok 的受挫再次警示,在短视频这种高密度、非结构化的内容生态中,多模态大模型的泛化能力仍不足以支撑高可靠性的自动化叙事。短期内,行业正从追求“全能描述”转向“垂直应用”,通过缩小认知边界来提升 AI 工具的实用价值与商业确定性。

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]