ChatGPT / AI新闻聚合

https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
✨BEST AI中转 https://api.oaibest.com 2.8折起支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN

6 小时前

图像编辑进入“思考”时代：腾讯发布混元图像 3.0 图生图模型

腾讯混元正式发布混元图像3.0图生图（HunyuanImage3.0-Instruct）模型。该模型目前已在腾讯旗下的 AI 助手“元宝”全端及腾讯混元官网同步上线，标志着腾讯在原生多模态图像处理领域取得新突破。

混元图像3.0图生图采用主流的混合专家（MoE）架构，总参数量达80B(激活参数约13B)。不同于传统的滤镜式修图，它被定义为一款“会思考”的图像编辑模型。在接收到用户的提示词和图片后，模型会先深度理解图像内容，随后自主推理出需要修改的区域和步骤，并精准保留无需变动的图像细节，从而实现更具逻辑感的输出效果。

在功能层面，该模型展现了极高的灵活性。它不仅支持基础的元素增删、风格变换及老照片修复，还具备强大的多图融合能力，能将多张照片中的人物或元素提取并合成。对于普通用户而言，这意味着可以直接在元宝上快速制作个性化表情包、虚拟合拍，甚至完成专业的电商海报设计和游戏角色定制。

为了打磨这一模型，混元团队构建了千万量级的图生图数据集，覆盖超过80个细分任务。通过引入思维链训练和自研的 MixGRPO 算法，模型在指令响应速度和图像一致性上均有显著提升。无论是在情绪表现力还是生成真实感上，混元图像3.0图生图都为 AI 图像创作提供了更专业、更易用的工具选择。

划重点:

● 🧠 自主推理编辑:混元图像3.0图生图能够先理解原图再执行指令，自动分析修改区域并保持非编辑区的一致性。
● 🎨 多场景功能覆盖:支持老照片修复、人物合影合成及复杂的文字修改，可广泛应用于电商海报、游戏定制等创意领域。
● ⚡ 性能与效率双增:基于80B MoE 架构及千万级数据集训练，模型生成的图像情绪张力更强，且生成速度较前代有明显提升。

via AI新闻资讯 (author: AI Base)

6 小时前

苹果 Siri 争夺战：Anthropic 惜败，谷歌 Gemini 凭“性价比”胜出

在 AI 重塑操作系统的关键节点，苹果公司（Apple）的一举一动都牵动着硅谷的神经。据最新消息披露，AI 初创巨头Anthropic曾深度接触苹果，意图通过其强大的大语言模型为Siri进行“换脑”级别的重构。

数十亿美元的“擦肩而过”

Anthropic此前向苹果提出了一项极具野心的多年期合作协议，涉及年费金额高达数十亿美元。然而，这场旨在让Siri彻底翻身的谈判在去年夏天陷入僵局，最终因合作条款未能达成一致而宣告停滞。

三巨头博弈:为什么是谷歌?

在重塑Siri的赛道上，苹果始终在进行多方权衡:

谷歌（Google）的逆袭:苹果最终选择了谷歌的Gemini模型。选择谷歌的原因不仅在于Gemini展现出的性能显著提升，更在于谷歌愿意接受苹果提出的财务合作框架。

OpenAI 的角色转换:尽管苹果曾考虑延续与OpenAI的早期伙伴关系，但目前OpenAI的角色被定位为“替补专才”——主要负责为Siri遇到的复杂查询提供解答服务。

话题追踪:苹果的 AI 漫漫长路

苹果在 AI 领域的布局并非一蹴而就。回顾近半年的动态，我们可以清晰看到其策略的摆动:

2025年8月:苹果曾尝试将Anthropic的Claude Sonnet4引入 Xcode 开发环境，显示出双方曾有过良好的技术磨合。

2025年11月:谷歌 Gemini胜出的迹象初显，被曝将在2026年正式驱动新版Siri。

2026年1月:Anthropic与苹果谈判破裂的细节最终曝光，为这场 AI “相亲”画上了句号。

随着2026年Siri升级计划的推进，谷歌的技术赋能将成为苹果 AI 战略的核心支柱。

via AI新闻资讯 (author: AI Base)

6 小时前

腾讯发布混元图像3.0图生图模型:语义理解驱动，“一句话”实现精准修图

1月26日，腾讯混元正式发布其最新的**混元图像3.0图生图（HunyuanImage3.0-Instruct）**模型。该模型补齐了混元在图像编辑与多图融合领域的重要版图，目前已在腾讯元宝全端及官网同步上线。

80B 参数巨兽:会思考、懂指令的图像编辑

混元图像3.0图生图模型总参数量达80B（激活参数约13B），采用先进的混合专家(MoE)架构。与传统修图工具不同，该模型具备卓越的语义理解与推理能力:在接收到图片和提示词后，它会先分析图像内容并拆解编辑步骤，精准识别需要修改与保留的区域。

依托于千万量级的图生图数据及自研 MixGRPO 算法，模型在保持非编辑区域一致性、指令响应速度以及真实感表现上均有显著提升。

全场景覆盖:从老照片修复到多图合照

该模型支持80余种细分任务，为用户提供多样化的创作能力:

● 图片精修: 支持对光线、皮肤及背景进行增删改，甚至可在不破坏布局的情况下修改图片中的文字。
● 风格变换: 实现真人变漫画、像素风格转化或老照片修复。
● 深度融合: 支持提取多张照片中的人物或元素，快速合成全新的合照或创意图片。

目前，用户可以通过腾讯元宝体验 AI 制作表情包、虚拟合拍及电商海报设计等功能。这标志着大模型 P 图正式进入“意图驱动”的高效时代。

via AI新闻资讯 (author: AI Base)

7 小时前

整治“越界”聊天：Meta 全面关停青少年访问 AI 角色功能

针对近期频发的 AI 聊天机器人合规性争议，社交巨头 Meta 近日采取了果断行动。Meta 已决定在全球范围内停止青少年用户访问其平台上的“AI 角色（AI Characters）”功能。

这一举措源于此前的一系列风险报告。早在 2025 年夏季，就有内部文件曝光 Meta 的部分 AI 聊天机器人在与未成年人交流时，未能有效屏蔽涉及浪漫、情感甚至感官刺激的敏感话题。尽管 Meta 随后加强了关键词过滤，但为了彻底杜绝潜在的心理健康隐患，公司决定在未来数周内正式实施这项“禁令”。

据悉，该限制措施不仅涵盖了注册年龄为青少年的账户，还将利用 Meta 的年龄识别技术，精准识别并拦截那些虚报年龄的未成年用户。虽然由真人明星或虚构设定组成的“AI 角色”将被下线，但基础版的Meta AI助手仍将保留，并配备更严格的年龄适应性保护机制。

Meta 表示，此次关停并非永久性放弃该市场。目前，团队正在开发全新的家长监护工具，旨在让监护人对子女的 AI 交互拥有更高的透明度和控制权。只有当这一系列安全加固措施和修订版功能通过测试后，针对青少年的定制化 AI 角色才有可能重新开放。

via AI新闻资讯 (author: AI Base)

7 小时前

研究发现 Google AI 搜索引用 YouTube 频率远超专业医疗网站

Google推出的 AI 搜索功能（AI Overviews）正面临新的信任危机。一项针对 5 万多条健康相关查询的研究发现，该 AI 工具在回答医疗问题时，引用自YouTube的频率竟然超过了任何专业医疗网站。这一发现引发了学术界和公共卫生专家对 AI 生成健康信息可靠性的深度担忧。

这项由 SE Ranking 开展的研究主要分析了来自德国的健康搜索数据。结果显示，在所有 AI 摘要引用源中，YouTube以 4.43% 的占比位居榜首。相比之下，没有任何一家医院网络、政府卫生门户或学术机构的引用率能与之抗衡。研究人员指出，YouTube并非专业的医学出版平台，其内容涵盖了从执业医生到缺乏医学背景的健康网红等各类创作者，信息的严谨性难以保障。

专家警告称，Google AI 以“自信权威”的口吻给出的摘要正潜移默化地影响着全球每月近 20 亿的用户。瑞士巴塞尔大学的研究员 Hannah van Kolfschooten 指出，这项研究证明了 AI 在健康领域的风险是结构性的，这表明Google的算法可能更倾向于内容的“知名度”和“可见度”，而非医学上的“可靠性”。

对此，Google发言人回应称，AI Overviews 旨在展示来自信誉良好来源的高质量内容，且研究数据中 96% 的热门YouTube引用确实来自医疗机构频道。然而，研究人员反驳称，这仅代表了极小部分的视频样本，大部分被引用的视频内容仍缺乏严格的医学审计。此前，《卫报》的一项调查也曾发现 Google AI 在提供肝功能测试信息时出现了严重的误导性错误。

via AI新闻资讯 (author: AI Base)

7 小时前

马化腾年会放话:元宝春节豪分10亿现金，欲重现微信红包“珍珠港偷袭”

在今日腾讯年会上，马化腾宣布 AI 应用“元宝”将于2月1日开启春节分 10亿元现金活动，单人最高可领万元，旨在重现2015年微信红包的爆发式增长。马化腾同时揭秘了此前处于“绝密”状态的项目——社交 AI 玩法**“元宝派”**，标志着腾讯正式将 AI 战火引向其核心社交领地。

**“元宝派”**致力于构建 AI 深度参与的多人社交空间。AI 在派内不仅能总结群聊、担任健身与阅读打卡的“监督员”，还支持图片二创生成梗图。更具突破性的是，该产品接入了腾讯会议的音视频底层能力，支持好友“一起看、一起听”的沉浸式娱乐，将 AI 从个人工具进化为社交纽带。

目前元宝派已深度打通微信、QQ 生态，支持一键分享与丝滑加入。腾讯此举意在利用社交基因破解 AI 留存难题，通过春节期间的重金利诱与场景创新，试图在大模型下半场实现“诺曼底登陆”，定义人机社交新形态。

via AI新闻资讯 (author: AI Base)

7 小时前

融资 50 亿刷新纪录！印奇加盟阶跃星辰，大模型“季后赛”杀向物理世界

在大模型赛道进入“常规赛”收尾、集体寻求 IPO 的关键期，阶跃星辰选择了一条截然不同的突围之路。近日，阶跃星辰宣布完成超50亿元人民币的 B+ 轮融资，不仅刷新了近一年来国内大模型赛道的单笔融资纪录，更引来了一位重磅人物挂帅。

顶级资本加持，单笔融资破纪录

本次融资由上国投先导基金、国寿股权等多家知名机构参与，腾讯、五源资本等老股东也选择继续跟投。这一规模不仅超过了月之暗面此前的5亿美元融资，甚至超过了一些友商 IPO 的募集金额，显示出资本市场对阶跃星辰战略路线的高度认可。

“两栖”大咖印奇出任董事长

比融资更令行业震动的是人事变动:旷视科技创始人、千里科技董事长印奇正式走到台前，出任阶跃星辰董事长。

强强联手:由姜大昕、张祥雨、朱亦博组成的顶级技术“国家队”，迎来了最具落地经验的商业领袖。

战略互补:印奇的加入将全面负责产业落地，弥补技术团队在商业经验上的短板。

核心战场转移:人工智能走出数据中心

阶跃星辰认为，大模型单纯比拼参数和 Token 的时代已经过去，2026年起的“季后赛”核心命题是:如何让 AI 接管物理终端。

原生多模态:进入世界的门票

阶跃坚持“原生多模态”路线，直接进行端到端训练，让 AI 拥有类似人类的“感官系统”，而非简单的文字转化。其音频模型 Step-Audio-R1.1已在权威榜单中取得全球第一。

终端落地:手机与汽车双轮驱动

手机领域:已与国内60% 的头部品牌深度合作（如 OPPO、荣耀、中兴），装机量突破4200万台。

汽车领域:深度赋能吉利银河等品牌，将语音模型集成至智能座舱，目标今年装车量达百万级。

VLA 架构:从理解到主动交互

推出业内首款可部署的开源 GUI 模型 Step-GUI，让大模型具备“读屏”和“代操作”能力，变身真正的智能 Agent。

当其他玩家通过 IPO 寻求确定性时，阶跃星辰带着重金，联手具备穿越周期能力的印奇，试图构建一个从前沿模型到物理终端的完整闭环。正如业内评价:大模型必须嵌入物理世界的骨架，才能获得长久的生命力。

via AI新闻资讯 (author: AI Base)

8 小时前

谁是谁的“老师”？Mistral CEO 称 DeepSeek 借鉴其架构引发技术圈热议

近日，一场关于 AI 架构起源的争论在社交媒体上闹得沸沸扬扬。被誉为“欧洲版 OpenAI”的MistralCEO Arthur Mensch 在接受访谈时表示，中国强劲的开源模型DeepSeek-V3实际上是基于 Mistral 提出的架构构建的。此番言论一出，立即引来了全球开发者和网友的围观与质疑。

核心争议:是“致敬”还是“自主创新”?

Arthur Mensch 在访谈中提到，Mistral 在2024年初发布了首个稀疏混合专家模型（MoE），而他认为 DeepSeek 随后的版本都是在此基础上构建的，称其“采用了相同的架构”。

然而，严谨的网友通过查阅 arXiv 上的原始论文发现了疑点:

发布时间胶着:Mixtral的论文与DeepSeek MoE论文的发表时间仅相差3天，很难界定谁真正影响了谁。

架构思路迥异:虽然两者都属于稀疏混合专家系统（SMoE），但 Mixtral 更偏向工程优化，而 DeepSeek 在算法上进行了深度重构。

专家设计不同:DeepSeek 引入了“细粒度专家分割”和“共享专家”机制，将通用知识与特定知识解耦，这与 Mixtral 的扁平化专家设计有本质区别。

技术反转:谁在“岁月史书”?

令人玩味的是，这场争论很快出现了反转。有技术专家指出，与其说 DeepSeek 借鉴了 Mistral，倒不如说情况可能相反。

架构回流:2025年底发布的Mistral3Large被网友扒出，其底层架构反而与 DeepSeek-V3采用的 MLA 等创新技术高度相似。

影响力变迁:网友调侃称，Mistral 似乎在试图通过“改写历史”来挽回技术领先地位的流失，因为 DeepSeek 在 MoE 架构的创新上显然获得了更大的行业影响力。

AI 界的“共同进步”还是“嘴炮大战”?

尽管存在争论，但正如 Mensch 在访谈前半部分所说，开源精神的核心在于“大家在彼此的基础上不断进步”。

竞争白热化:DeepSeek已被曝瞄准2026年春节档，准备发布更强的新模型。

开源之争:Mistral 也在持续更新其Devstral家族，试图夺回开源编程智能体的高地。

这场“口水仗”背后，反映出全球顶尖 AI 实验室在技术迭代速度上的极度焦虑。在代码与公式面前，单纯的口头宣誓往往无力，真正的胜负终将在模型性能的实测中揭晓。

via AI新闻资讯 (author: AI Base)

8 小时前

👑 专家评特朗普“新王室”外交：以个人利益取代国家利益

政治学者 Stacie Goddard 与 Abraham L. Newman 在《纽约时报》撰文指出，特朗普的外交政策并非传统的“大国竞争”，而是一种类似于 16 世纪的“新王室主义”。该模式将外交政策工具化，核心目标是为特朗普及其亲信圈子获取金钱与地位，导致国家利益被精英阶层的私利所取代。文章提到，特朗普的“宫廷圈子”由马可·卢比奥、埃隆·马斯克、史蒂夫·威特科夫及贾里德·库什纳等亲信组成，外交决策权高度集中于这一排他性网络。

在具体行动上，特朗普对格陵兰岛的主权要求引发了丹麦与法国等盟友的困惑。在委内瑞拉问题上，特朗普宣布控制 5000 万桶原油，而其大捐助者保罗·辛格旗下的公司则获得了委内瑞拉在美石油子公司 Citgo 的控制权。贸易政策方面，关税被视为向各国及企业索取“贡品”的手段，例如越南在寻求关税减免的同时批准了特朗普家族价值 15 亿美元的高尔夫球场项目。此外，在特朗普扭转英伟达对阿联酋的芯片出口禁令前，阿联酋支持的投资者向特朗普家族关联的加密货币公司注资了 20 亿美元。

作者警告，这种基于榨取和支配的秩序正在侵蚀以规则为基础的国际体系。尽管部分国家选择通过赠送金礼或赞美来换取短期利益，但加拿大总理马克·卡尼等领导人呼吁各国建立多边替代方案，通过加强欧盟与南方共同市场的贸易整合及提升欧洲防务独立性，以抵御这种“新王室主义”的扩张。文章强调，这种模式的本质是少数人的榨取，而非多数人的安全与繁荣。

(NYT > China)

via 茶馆 - Telegram Channel

8 小时前

全球首创:京东购物智能体 JoyGlance 正式登陆乐奇 AI 眼镜

1月26日，京东科技旗下购物智能体 JoyGlance 正式上线智能眼镜头部品牌乐奇 Rokid，标志着全球首款智能眼镜购物应用进入实际可用阶段。此次上线是双方在2025年底官宣战略合作后的全面能力打通。

通过将 JoyAI 大模型的意图识别、智能搜品能力与Rokid的光波导显示及语音交互深度融合，智能眼镜已升级为全新的 AI 购物入口。

● 交互简化: 用户只需通过简单的语音指令（如“乐奇，帮我搜同款”）即可识别商品。
● 高效流程: 购物流程从传统的“搜索、浏览、比价、下单、支付”简化为极致的“说、看、付”。

在支付环节，JoyGlance 采用了“语音识别 + 声纹识别”的金融级安全方案。该方案能有效防范录音攻击和声纹合成风险，在确保自然交互体验的同时，为用户的资金安全提供了坚实保障。

via AI新闻资讯 (author: AI Base)

8 小时前

腾讯“元宝派”开启内测：AI 深度潜入微信、QQ 社交圈

腾讯旗下 AI 助手“元宝”今日低调开启了全新社交玩法“元宝派”的内部测试。作为腾讯在 AI 领域的一次关键创新，“元宝派”旨在探索 AI 技术在多人社交场景下的深度融合，致力于打造一个让 AI 与用户群体共同娱乐、协作的全新“社交空间”。这一动作标志着腾讯正将 AI 的应用方向从单一的效率工具，延伸至连接人与人、增进群体互动的社交属性。

在核心玩法上，“元宝派”赋予了 AI 极强的参与感。用户可以自由创建或加入不同的“派”，并直接在群内 @元宝总结聊天要点，或引用其回复。此外，元宝 AI 还能化身“监督员”，协助用户发起健身、阅读等兴趣打卡活动。除了文字交互，派内还支持“图片二创”功能，让用户能将普通照片快速转化为有趣的梗图或表情包，在共同创作中激发社交乐趣。

技术底层方面，元宝派展现了腾讯跨产品协作的深度。据悉，后续公测将上线基于腾讯会议音视频能力的“一起看”和“一起听”功能。该玩法允许用户邀请派内好友同步观看电影、球赛或聆听音乐。通过引入专业级的音视频底层技术，腾讯试图在 AI 社交空间内重构沉浸式的多人协同娱乐体验，让 AI 真正融入用户的日常生活场景。

为了实现用户增长的“丝滑”过渡，元宝派与微信、QQ 等国民级社交产品深度打通。用户可以通过分享“派号”或专属链接，邀请微信和 QQ 好友一键加入。在此之前，元宝已实现了在社交平台内的多点触达:用户不仅能将“元宝”添加为好友随时互动，还能在公众号、视频号评论区通过 @元宝快速总结内容或进行拓展提问。

从行业视角看，腾讯此举无疑是将 AI 战局拉进了自己最擅长的“社交场”。通过“元宝派”，腾讯试图打开一种全新的人与 AI 交互模式，即 AI 不再仅仅是冷冰冰的问答机器，而是能够润滑人际关系、提升群体活跃度的社交参与者。这种尝试为当前同质化严重的大模型应用市场提供了一个基于社交关系链的“新解题思路”，也预示着社交 AI 时代的全面到来。

via AI新闻资讯 (author: AI Base)

8 小时前

打破行业纪录！阶跃星辰获超 50 亿元融资，印奇正式出任董事长

中国大模型赛道投下了一颗“重磅炸弹”。上海大模型初创企业阶跃星辰正式宣布完成超过 50 亿元人民币的 B+ 轮融资。这一数字不仅刷新了过去 12 个月以来国内大模型领域的单笔融资最高纪录，也标志着国产基座模型的竞争进入了资本与人才双重加码的新阶段。

本轮融资阵容极度豪华，汇聚了多家顶级产业投资人。参与方包括上国投先导基金、国寿股权、浦东创投、徐汇资本等具有雄厚实力的机构。与此同时，腾讯、启明创投、五源资本等老股东也选择继续跟投，展现出资本市场对阶跃星辰技术路径和商业前景的高度一致认可。

在资金入场的同时，阶跃星辰的核心管理团队也迎来了关键升级。官方宣布，人工智能领域的资深专家印奇正式出任公司董事长，全面负责公司战略节奏与技术方向的制定。印奇将与 CEO 姜大昕、首席科学家张祥雨以及 CTO 朱亦博组成“四人核心团”，共同推动基础大模型的技术研发，并加速“AI + 终端”的商业化落地。

据悉，这笔高达 50 亿元的巨资将精准投向基础模型的研发领域。阶跃星辰将打造全球顶尖的基座模型，并以此为支撑，加速推动 AI 智能在手机、PC 等各类终端上的战略应用，构建从底层技术到商业终端的完整闭环。

via AI新闻资讯 (author: AI Base)

8 小时前

特朗普救助掩盖困境华尔街日报：英特尔错失良机被“打回原形”

via cnBeta.COM - 中文业界资讯站 (author: 稿源：凤凰网科技)

Telegraph

特朗普救助掩盖困境华尔街日报：英特尔错失良机被“打回原形”

1月26日，据《华尔街日报》报道，美国总统特朗普对英特尔的救助，一度让投资者对这家老牌芯片公司重新燃起希望。然而，英特尔的新一季财报表明，该公司依旧身处困境。当特朗普承诺向英特尔提供近90亿美元资金，并将其视为符合“美国优先”政策的科技公司时，一个新的时代似乎就此开启。投资者预计这家麻烦缠身的芯片制造商会接到新的订单，推动英特尔股价在五个月内飙升了120%。英特尔CEO陈立武英特尔的产品需求确实在飙升，但英特尔却没有为此做好准备。在连月削减了老款生产线的产能后，该公司对AI数据中心CPU处理器的订单…

9 小时前

前索契主帅因过度使用AI被解雇 AI选的前锋10场0进球

前西班牙国家队主帅罗伯特·莫雷诺因在执教决策中严重依赖人工智能聊天机器人ChatGPT，已被俄罗斯足球甲级联赛球队索契俱乐部解雇。报道称，这位48岁的教练在去年9月离任，彼时他带队出战7场联赛仅收获1个积分，战绩惨淡。

索契俱乐部前体育总监安德烈·奥尔洛夫透露，莫雷诺对ChatGpt产生了异乎寻常的依赖，其依据ChatGPT给出的建议所做出的决策，最终给球队带来了灾难性后果。

在执掌索契教鞭期间，莫雷诺完全按照ChatGPT的推荐，推行了一系列怪异的训练方案与转会策略。

一个典型案例发生在球队远赴哈巴罗夫斯克的客场赛事中，当时他严格遵照ChatGPT生成的行程安排执行，丝毫不肯变通。

这份行程要求球员连续28小时保持清醒状态，并且要在比赛前两天的早上7点参加一场训练课。

莫雷诺对人工智能的依赖，甚至延伸到了夏季转会窗口的引援工作中。他通过输入球员数据到ChatGPT来挑选前锋，最终签下舒舍纳切夫，但该球员在十场比赛中未进一球。

奥尔洛夫指出，AI本可作为辅助工具，但莫雷诺将其视为主力手段，引发俄罗斯球员不满和外援信心丧失。

在莫雷诺任期内，索契从俄罗斯超级联赛降级至甲级联赛，他还因忽视定位球训练招致球迷批评。

据了解，莫雷诺曾以临时主帅身份执教西班牙国家队，后转为正式主帅，带队九场比赛取得不败战绩后辞职。

via cnBeta.COM - 中文业界资讯站 (author: 稿源：快科技)

10 小时前

机器人感知进化：全球首个跨本体视触觉大模型数据集“白虎-VTouch”震撼发布

via AI新闻资讯 (author: AI Base)

Telegraph

机器人感知进化：全球首个跨本体视触觉大模型数据集“白虎-VTouch”震撼发布

在机器人向“具身智能”全面迈进的今天，如何让钢铁之躯拥有像人类一样灵敏的“触感”，成为了突破精细化操作瓶颈的关键。2026年1月26日，国地中心联合纬钛机器人正式发布了全球首个、也是目前规模最大的跨本体视触觉（Vision-Based Tactile Sensor）多模态数据集——白虎-VTouch。这一数据集的诞生，不仅填补了机器人视触觉交互领域的空白，更为全球机器人开发者提供了一座高价值的数字矿山。全球最大规模:60，000分钟的“真实触感” 不同于以往单一、碎片化的实验数据，白虎-VTouch …

10 小时前

机器人触觉“大爆发”：全球首个超大规模跨本体视触觉数据集“白虎-VTouch”发布

近日，国地中心联合纬钛机器人发布了全球首个，也是目前规模最大、模态最完整的跨本体视触觉多模态机器人操作数据集:白虎 - VTouch。该数据集的发布，标志着机器人视触觉感知从单一形态向跨本体真实交互的跨越。

白虎 - VTouch首创了跨本体视触觉多模态真实交互的数据采集新范式。它不仅包含高精度的视触觉传感器数据，还集成了 RGB-D 深度视觉、关节位姿等关键信息，数据集总时长超过60000分钟。为了确保通用性，数据采集涵盖了全尺寸人形机器人（青龙）、类人形轮式机器人以及手持智能终端等多种构型。

在细节表现上，该数据集采用了支持640×480分辨率及120Hz 刷新率的高性能传感器，能够精准捕捉物体接触时的微小变化。目前，数据集已积累约9072万对真实物体接触样本，重点覆盖了家居、餐饮、工业及特种作业四大场景中的260多个接触密集型任务。

研究显示，在引入视触觉感知后，近七成的任务获得了更连续的接触状态描述。这将为机器人的精细化操作、精准力控以及在任务失败后的自我恢复提供至关重要的底层数据支持。

via AI新闻资讯 (author: AI Base)

10 小时前

物理世界的“数字光脑”：上海交大发布 Optics GPT，垂直大模型再下一城

在通用大模型如潮水般涌现的当下，人工智能正加速向硬科技的深水区挺进。2026年1月26日，上海交通大学正式发布了光领域垂直大模型Optics GPT。这一成果不仅标志着我国在“AI+硬科技”交叉融合领域取得重要突破，更通过精准的专业洞察，为光学研发装上了一颗聪明的“数字大脑”。

“资深专才”:像培养博士生一样炼成 AI 专家

如果说 ChatGPT 是无所不知的“博学通才”，那么Optics GPT就是一位深耕实验室的“资深专才”。它通过深度学习光学领域的专业知识，能够像“虚拟光学专家”一样深度理解光学原理，为科研、设计与教学提供高可靠性的智能化支持。

为了验证其实战能力，团队构建了涵盖以下六大核心方向的专业评测集:

基础理论:光物理、光量子;

前沿技术:非线性光学、光计算;

工程应用:光学设计、光通信。

评测结果显示，Optics GPT在所有核心维度上均优于主流通用大模型，充分验证了“小规模专业化模型”在垂直领域超越“巨型通用模型”的技术路径。

四大硬核标签，重塑行业准入门槛

作为一款专为行业而生的模型，Optics GPT具备以下显著特点:

轻量化部署:模型规模仅为8B 参数级，支持在端侧与边缘高效运行，极大降低了中小企业的应用门槛。

高认知素养:系统性注入光学专业知识，使其形成了精准的物理直觉。

强应用落地:在算法生成、系统诊断、仿真设计等核心场景中表现领先。

安全全可控:数据构建、模型训练到部署运行全流程自主可控，保障了核心产业的数据隐私。

随着Optics GPT的发布，光学领域的研发范式正迎来革命性变化。从繁琐的实验辅助到复杂的系统诊断，AI 正在从幕后走向台前，成为科学家与工程师最默契的数字化搭档。

via AI新闻资讯 (author: AI Base)

Before

After

Home