https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
英伟达、谷歌联合押注:虚拟人初创企业 Synthesia 获 2 亿美元融资,估值翻倍

英国人工智能独角兽Synthesia宣布完成 2 亿美元(约合 13.94 亿元人民币)的融资。本轮融资后,其投后估值直接飙升至 40 亿美元,较一年前近乎翻倍,巩固了其作为欧洲最具价值 AI 企业之一的地位。

本轮融资由谷歌母公司 Alphabet 旗下的风投基金 **GV(谷歌风投)领投,现有投资方英伟达(NVIDIA)**和 Accel 持续加码。这笔资金将用于研发新一代交互式音视频“智能虚拟助手”。与以往只能按照脚本“读稿”的数字人不同,Synthesia 的新产品旨在实现围绕特定主题的实时对话,首批应用将锁定在企业的销售培训、招聘面试及技能提升场景。

Synthesia首席执行官维克多·里帕尔贝利(Victor Riparbelli)表示,公司已战略性地放弃了竞争激烈的消费级广告市场(曾为梅西打造虚拟形象),转而深耕利润更丰厚且需求更稳固的企业级沟通市场。目前,其年度经常性收入(ARR)已突破 1 亿美元,客户名单包括微软、福特汽车和瑞银集团等全球巨头。

尽管技术仍在迭代中——在近期演示中,交互式虚拟人偶尔仍会有“数字合成感”及网络延迟导致的违规感——但投资方显然看好其解决企业员工培训痛点的能力。通过将原本昂贵的真人视频制作流程转化为简单的文字输入,Synthesia正在重新定义企业数字化转型的交互方式。

via AI新闻资讯 (author: AI Base)
JetBrains IDE 深度集成 OpenAI Codex,开启智能体协作新模式

知名开发工具厂商JetBrains宣布,旗下全系列 IDE 已原生集成 OpenAI 的Codex模型。从2025.3版本开始,开发者可以直接在 AI 聊天功能中调用这一强大的编码引擎,处理更为复杂的真实开发任务。

此次集成的最大亮点在于其灵活性。用户不仅可以使用JetBrains AI原生订阅,还可以通过绑定自己的 ChatGPT 账户或输入 OpenAI API 密钥来激活Codex。包括IntelliJ IDEA、PyCharm、WebStorm 和 Rider 在内的多款主流 IDE 均已同步支持此功能。

与传统的代码补全不同,Codex在 IDE 中更像是一个具备自主权的“编程助手”。开发者可以根据需求为其分配权限——从简单的代码问答,到授权其访问网络甚至自主运行终端命令。这种“智能体”式的交互允许 AI 参与到逻辑推理、行动执行及代码迭代的全过程中,而开发者则可以根据任务难度,在聊天界面中随时调整推理深度、生成速度与成本预算。

为了吸引更多开发者体验,JetBrains 还推出了一项限时福利:从1月22日起,通过JetBrains AI访问 Codex agent 将提供免费使用额度,直至促销额度分配完毕。

via AI新闻资讯 (author: AI Base)
MiniMax M2.1强力驱动 Clawdbot,开启24小时开源 AI 助手时代

1月26日,知名开源项目 Clawdbot 在技术社区持续走红。这款由 PSPDFKit 创始人 Peter Steinberger 创建的开源、自托管 AI 助手,在接入 MiniMax M2.1 模型能力支持后,已在 GitHub 上收获超过 30,000stars

深度适配:以极低成本撬动生产力杠杆

在用户的实际测评中,MiniMax M2.1 展现出了极高的“质价比”。开发者普遍反馈,M2.1在处理全栈任务和工具调用方面表现出色且准确度极高。相较于同类大模型,其 API 与 Coding Plan 套餐 满足了24/7持续运行的需求,让用户能以几乎可以忽略不计的边际成本,实现“超级智能体”工作流。

应用场景:从繁琐日常到技术开发

基于 M2.1 强大的逻辑能力,Clawdbot 正在改变人们与数字工具交互的方式:

● 复杂任务处理: 它能自动比较十几家经销商报价、发送邮件跟进,甚至处理保险理赔和航班值机。
● 技术工作流集成: 在开发场景中,它可监控 GitHub Actions、自动运行测试,并在发现 bug 后自主创建 issue 并尝试修复。
● 跨平台控制: 用户可通过 Telegram、WhatsApp、iMessage 等聊天软件,向托管在本地服务器(如 Mac Mini)上的助手发送指令,无需操作任何复杂的用户界面。

未来愿景:告别 UI 的“超级智能体”时代

海外资深开发者 Tom Osman 指出,未来我们与工具的大部分交互将通过这类“超级智能体”以编程方式进行,日常需要交互的 UI 数量将大幅下降。ClawdbotMiniMax 的结合,不仅为开发者提供了极速构建技能(Skills)的途径,更让每一个用户都能拥有一个24小时在线、具有累积记忆且不断自我优化的私有化 AI 管家。

via AI新闻资讯 (author: AI Base)
分不清是真人还是机器?通义千问“任务助理”代打电话功能引发热烈讨论

你是否想过,有一天帮你打电话订餐厅的可能不是秘书,而是一个 AI?最近,阿里旗下的通义千问App 推出的“打电话订餐厅”功能正式开启邀测,因其极具真实感的语音表现,在网络上引发了广泛关注。

AI 订餐:真假难辨的社交“替身”

这项由“任务助理”提供的创新功能,彻底打破了人们对 AI 语音冰冷、生硬的固有印象。

全自动沟通:AI 能根据用户提出的时间、人数等需求,自动拨打商家电话。

情绪化表达:不仅能与店员流畅沟通并记录对话,其语音语调甚至能表达出细腻的情绪,让电话另一端的真人难以察觉其 AI 身份。

共情式回应:该功能依托于专利级的实时情绪与意图识别引擎,能够在毫秒级内识别复杂的语音情绪,并作出充满共情的回应。

科技碰撞:当 AI 遇上 AI

有趣的是,随着科技的普及,这种“智能化”并非单向。知名火锅品牌海底捞也已采用智能订餐助手。这意味着,在不久的将来,订餐电话的两端可能都是 AI,开启一场高效率、零尴尬的“机器对话”。

数字化生活的“减负”新体验

对于忙碌的上班族或是有“社交恐惧症”的用户来说,通义千问这一功能的推出无疑提供了一种全新的减负方案。从单纯的文字交互到深度的语音代办,AI 正在从“问答机”向“执行者”进化,真实地介入到我们的物理生活场景中。

via AI新闻资讯 (author: AI Base)
AI算力供需失衡:封测与存储迎来涨价潮,端侧 AI 开启“硬件进化”新纪元

在全球 AI 浪潮的席卷下,算力需求正以前所未有的速度撕裂现有的硬件供需平衡。近日,东方证券发布的最新研报指出,算力需求的爆发式增长已直接传导至产业链上游,封测与存储领域正迎来一场深刻的行业变革。

硬件失衡:封测涨价与存储翻倍

由于 AI 芯片对先进封装的需求激增,加之原材料成本上涨的压力,各大封测厂已纷纷调高服务价格。 与此同时,存储器产业正处于爆发前夜,据预测,到2026年,全球存储器年产值有望突破5,516亿美元,实现134% 的惊人增长。

国产替代:技术跨越与市场机遇

在政策与需求的双重驱动下,国产算力产业链正展现出极强的生命力:

算力芯片破局:寒武纪、海光信息及摩尔线程等本土企业加速崛起,在高性能计算领域不断缩短与国际巨头的差距。

存储技术飞跃:长电科技与长江存储在封装工艺和存储架构上实现了跨越式发展,为国产算力的安全可控奠定了坚实基础。

政策利好传导:随着美国放宽部分芯片出口限制,国内服务器市场有望迎来新一轮的需求反弹。

消费终端:从“云端”走向“耳边”

AI 的下半场竞争正从数据中心转向消费者的指尖与耳边。研报强调,端侧 AI 的落地将加速创新硬件的普及:

新型形态涌现:AI 耳机、智能眼镜等不仅是新的交互入口,更是产业链的新增长点。

产业链协同:互联硬件、被动元件及 CPU 需求均受到强劲提振。

专家警示:尽管前景广阔,但投资者仍需关注 AI 应用落地速度不及预期、原材料价格剧烈波动以及终端市场需求疲软等潜在风险。

via AI新闻资讯 (author: AI Base)
图像编辑进入“思考”时代:腾讯发布混元图像 3.0 图生图模型

腾讯混元正式发布混元图像3.0图生图(HunyuanImage3.0-Instruct)模型。该模型目前已在腾讯旗下的 AI 助手“元宝”全端及腾讯混元官网同步上线,标志着腾讯在原生多模态图像处理领域取得新突破。

混元图像3.0图生图采用主流的混合专家(MoE)架构,总参数量达80B(激活参数约13B)。不同于传统的滤镜式修图,它被定义为一款“会思考”的图像编辑模型。在接收到用户的提示词和图片后,模型会先深度理解图像内容,随后自主推理出需要修改的区域和步骤,并精准保留无需变动的图像细节,从而实现更具逻辑感的输出效果。

在功能层面,该模型展现了极高的灵活性。它不仅支持基础的元素增删、风格变换及老照片修复,还具备强大的多图融合能力,能将多张照片中的人物或元素提取并合成。对于普通用户而言,这意味着可以直接在元宝上快速制作个性化表情包、虚拟合拍,甚至完成专业的电商海报设计和游戏角色定制。

为了打磨这一模型,混元团队构建了千万量级的图生图数据集,覆盖超过80个细分任务。通过引入思维链训练和自研的 MixGRPO 算法,模型在指令响应速度和图像一致性上均有显著提升。无论是在情绪表现力还是生成真实感上,混元图像3.0图生图都为 AI 图像创作提供了更专业、更易用的工具选择。

划重点:

🧠 自主推理编辑:混元图像3.0图生图能够先理解原图再执行指令,自动分析修改区域并保持非编辑区的一致性。
🎨 多场景功能覆盖:支持老照片修复、人物合影合成及复杂的文字修改,可广泛应用于电商海报、游戏定制等创意领域。
性能与效率双增:基于80B MoE 架构及千万级数据集训练,模型生成的图像情绪张力更强,且生成速度较前代有明显提升。

via AI新闻资讯 (author: AI Base)
苹果 Siri 争夺战:Anthropic 惜败,谷歌 Gemini 凭“性价比”胜出

在 AI 重塑操作系统的关键节点,苹果公司(Apple)的一举一动都牵动着硅谷的神经。据最新消息披露,AI 初创巨头Anthropic曾深度接触苹果,意图通过其强大的大语言模型为Siri进行“换脑”级别的重构。

数十亿美元的“擦肩而过”

Anthropic此前向苹果提出了一项极具野心的多年期合作协议,涉及年费金额高达数十亿美元。然而,这场旨在让Siri彻底翻身的谈判在去年夏天陷入僵局,最终因合作条款未能达成一致而宣告停滞。

三巨头博弈:为什么是谷歌?

在重塑Siri的赛道上,苹果始终在进行多方权衡:

谷歌(Google)的逆袭:苹果最终选择了谷歌的Gemini模型。选择谷歌的原因不仅在于Gemini展现出的性能显著提升,更在于谷歌愿意接受苹果提出的财务合作框架。

OpenAI 的角色转换:尽管苹果曾考虑延续与OpenAI的早期伙伴关系,但目前OpenAI的角色被定位为“替补专才”——主要负责为Siri遇到的复杂查询提供解答服务。

话题追踪:苹果的 AI 漫漫长路

苹果在 AI 领域的布局并非一蹴而就。回顾近半年的动态,我们可以清晰看到其策略的摆动:

2025年8月:苹果曾尝试将Anthropic的Claude Sonnet4引入 Xcode 开发环境,显示出双方曾有过良好的技术磨合。

2025年11月:谷歌 Gemini胜出的迹象初显,被曝将在2026年正式驱动新版Siri。

2026年1月:Anthropic与苹果谈判破裂的细节最终曝光,为这场 AI “相亲”画上了句号。

随着2026年Siri升级计划的推进,谷歌的技术赋能将成为苹果 AI 战略的核心支柱。

via AI新闻资讯 (author: AI Base)
腾讯发布混元图像3.0图生图模型:语义理解驱动,“一句话”实现精准修图

1月26日,腾讯混元正式发布其最新的**混元图像3.0图生图(HunyuanImage3.0-Instruct)**模型。该模型补齐了混元在图像编辑与多图融合领域的重要版图,目前已在腾讯元宝全端及官网同步上线。

80B 参数巨兽:会思考、懂指令的图像编辑

混元图像3.0图生图模型总参数量达80B(激活参数约13B),采用先进的混合专家(MoE)架构。与传统修图工具不同,该模型具备卓越的语义理解与推理能力:在接收到图片和提示词后,它会先分析图像内容并拆解编辑步骤,精准识别需要修改与保留的区域。

依托于千万量级的图生图数据及自研 MixGRPO 算法,模型在保持非编辑区域一致性、指令响应速度以及真实感表现上均有显著提升。

全场景覆盖:从老照片修复到多图合照

该模型支持80余种细分任务,为用户提供多样化的创作能力:

● 图片精修: 支持对光线、皮肤及背景进行增删改,甚至可在不破坏布局的情况下修改图片中的文字。
● 风格变换: 实现真人变漫画、像素风格转化或老照片修复。
● 深度融合: 支持提取多张照片中的人物或元素,快速合成全新的合照或创意图片。

目前,用户可以通过腾讯元宝体验 AI 制作表情包、虚拟合拍及电商海报设计等功能。这标志着大模型 P 图正式进入“意图驱动”的高效时代。

via AI新闻资讯 (author: AI Base)
整治“越界”聊天:Meta 全面关停青少年访问 AI 角色功能

针对近期频发的 AI 聊天机器人合规性争议,社交巨头 Meta 近日采取了果断行动。Meta 已决定在全球范围内停止青少年用户访问其平台上的“AI 角色(AI Characters)”功能。

这一举措源于此前的一系列风险报告。早在 2025 年夏季,就有内部文件曝光 Meta 的部分 AI 聊天机器人在与未成年人交流时,未能有效屏蔽涉及浪漫、情感甚至感官刺激的敏感话题。尽管 Meta 随后加强了关键词过滤,但为了彻底杜绝潜在的心理健康隐患,公司决定在未来数周内正式实施这项“禁令”。

据悉,该限制措施不仅涵盖了注册年龄为青少年的账户,还将利用 Meta 的年龄识别技术,精准识别并拦截那些虚报年龄的未成年用户。虽然由真人明星或虚构设定组成的“AI 角色”将被下线,但基础版的Meta AI助手仍将保留,并配备更严格的年龄适应性保护机制。

Meta 表示,此次关停并非永久性放弃该市场。目前,团队正在开发全新的家长监护工具,旨在让监护人对子女的 AI 交互拥有更高的透明度和控制权。只有当这一系列安全加固措施和修订版功能通过测试后,针对青少年的定制化 AI 角色才有可能重新开放。

via AI新闻资讯 (author: AI Base)
研究发现 Google AI 搜索引用 YouTube 频率远超专业医疗网站

Google推出的 AI 搜索功能(AI Overviews)正面临新的信任危机。一项针对 5 万多条健康相关查询的研究发现,该 AI 工具在回答医疗问题时,引用自YouTube的频率竟然超过了任何专业医疗网站。这一发现引发了学术界和公共卫生专家对 AI 生成健康信息可靠性的深度担忧。

这项由 SE Ranking 开展的研究主要分析了来自德国的健康搜索数据。结果显示,在所有 AI 摘要引用源中,YouTube以 4.43% 的占比位居榜首。相比之下,没有任何一家医院网络、政府卫生门户或学术机构的引用率能与之抗衡。研究人员指出,YouTube并非专业的医学出版平台,其内容涵盖了从执业医生到缺乏医学背景的健康网红等各类创作者,信息的严谨性难以保障。

专家警告称,Google AI 以“自信权威”的口吻给出的摘要正潜移默化地影响着全球每月近 20 亿的用户。瑞士巴塞尔大学的研究员 Hannah van Kolfschooten 指出,这项研究证明了 AI 在健康领域的风险是结构性的,这表明Google的算法可能更倾向于内容的“知名度”和“可见度”,而非医学上的“可靠性”。

对此,Google发言人回应称,AI Overviews 旨在展示来自信誉良好来源的高质量内容,且研究数据中 96% 的热门YouTube引用确实来自医疗机构频道。然而,研究人员反驳称,这仅代表了极小部分的视频样本,大部分被引用的视频内容仍缺乏严格的医学审计。此前,《卫报》的一项调查也曾发现 Google AI 在提供肝功能测试信息时出现了严重的误导性错误。

via AI新闻资讯 (author: AI Base)
马化腾年会放话:元宝春节豪分10亿现金,欲重现微信红包“珍珠港偷袭”

在今日腾讯年会上,马化腾宣布 AI 应用“元宝”将于2月1日开启春节分 10亿元现金活动,单人最高可领万元,旨在重现2015年微信红包的爆发式增长。马化腾同时揭秘了此前处于“绝密”状态的项目——社交 AI 玩法**“元宝派”**,标志着腾讯正式将 AI 战火引向其核心社交领地。

**“元宝派”**致力于构建 AI 深度参与的多人社交空间。AI 在派内不仅能总结群聊、担任健身与阅读打卡的“监督员”,还支持图片二创生成梗图。更具突破性的是,该产品接入了腾讯会议的音视频底层能力,支持好友“一起看、一起听”的沉浸式娱乐,将 AI 从个人工具进化为社交纽带。

目前元宝派已深度打通微信、QQ 生态,支持一键分享与丝滑加入。腾讯此举意在利用社交基因破解 AI 留存难题,通过春节期间的重金利诱与场景创新,试图在大模型下半场实现“诺曼底登陆”,定义人机社交新形态。

via AI新闻资讯 (author: AI Base)
融资 50 亿刷新纪录!印奇加盟阶跃星辰,大模型“季后赛”杀向物理世界

在大模型赛道进入“常规赛”收尾、集体寻求 IPO 的关键期,阶跃星辰选择了一条截然不同的突围之路。近日,阶跃星辰宣布完成超50亿元人民币 的 B+ 轮融资,不仅刷新了近一年来国内大模型赛道的单笔融资纪录,更引来了一位重磅人物挂帅。

顶级资本加持,单笔融资破纪录

本次融资由上国投先导基金、国寿股权等多家知名机构参与,腾讯、五源资本等老股东也选择继续跟投。 这一规模不仅超过了月之暗面此前的5亿美元融资,甚至超过了一些友商 IPO 的募集金额,显示出资本市场对阶跃星辰战略路线的高度认可。

“两栖”大咖印奇出任董事长

比融资更令行业震动的是人事变动:旷视科技创始人、千里科技董事长 印奇 正式走到台前,出任阶跃星辰董事长。

强强联手:由姜大昕、张祥雨、朱亦博组成的顶级技术“国家队”,迎来了最具落地经验的商业领袖。

战略互补:印奇的加入将全面负责产业落地,弥补技术团队在商业经验上的短板。

核心战场转移:人工智能走出数据中心

阶跃星辰认为,大模型单纯比拼参数和 Token 的时代已经过去,2026年起的“季后赛”核心命题是:如何让 AI 接管物理终端。

原生多模态:进入世界的门票

阶跃坚持“原生多模态”路线,直接进行端到端训练,让 AI 拥有类似人类的“感官系统”,而非简单的文字转化。 其音频模型 Step-Audio-R1.1已在权威榜单中取得全球第一。

终端落地:手机与汽车双轮驱动

手机领域:已与国内60% 的头部品牌深度合作(如 OPPO、荣耀、中兴),装机量突破4200万台。

汽车领域:深度赋能吉利银河等品牌,将语音模型集成至智能座舱,目标今年装车量达百万级。

VLA 架构:从理解到主动交互

推出业内首款可部署的开源 GUI 模型 Step-GUI,让大模型具备“读屏”和“代操作”能力,变身真正的智能 Agent。

当其他玩家通过 IPO 寻求确定性时,阶跃星辰带着重金,联手具备穿越周期能力的印奇,试图构建一个从前沿模型到物理终端的完整闭环。 正如业内评价:大模型必须嵌入物理世界的骨架,才能获得长久的生命力。

via AI新闻资讯 (author: AI Base)
谁是谁的“老师”?Mistral CEO 称 DeepSeek 借鉴其架构引发技术圈热议

近日,一场关于 AI 架构起源的争论在社交媒体上闹得沸沸扬扬。被誉为“欧洲版 OpenAI”的MistralCEO Arthur Mensch 在接受访谈时表示,中国强劲的开源模型DeepSeek-V3实际上是基于 Mistral 提出的架构构建的。此番言论一出,立即引来了全球开发者和网友的围观与质疑。

核心争议:是“致敬”还是“自主创新”?

Arthur Mensch 在访谈中提到,Mistral 在2024年初发布了首个稀疏混合专家模型(MoE),而他认为 DeepSeek 随后的版本都是在此基础上构建的,称其“采用了相同的架构”。

然而,严谨的网友通过查阅 arXiv 上的原始论文发现了疑点:

发布时间胶着:Mixtral的论文与DeepSeek MoE论文的发表时间仅相差3天,很难界定谁真正影响了谁。

架构思路迥异:虽然两者都属于稀疏混合专家系统(SMoE),但 Mixtral 更偏向工程优化,而 DeepSeek 在算法上进行了深度重构。

专家设计不同:DeepSeek 引入了“细粒度专家分割”和“共享专家”机制,将通用知识与特定知识解耦,这与 Mixtral 的扁平化专家设计有本质区别。

技术反转:谁在“岁月史书”?

令人玩味的是,这场争论很快出现了反转。有技术专家指出,与其说 DeepSeek 借鉴了 Mistral,倒不如说情况可能相反。

架构回流:2025年底发布的Mistral3Large被网友扒出,其底层架构反而与 DeepSeek-V3采用的 MLA 等创新技术高度相似。

影响力变迁:网友调侃称,Mistral 似乎在试图通过“改写历史”来挽回技术领先地位的流失,因为 DeepSeek 在 MoE 架构的创新上显然获得了更大的行业影响力。

AI 界的“共同进步”还是“嘴炮大战”?

尽管存在争论,但正如 Mensch 在访谈前半部分所说,开源精神的核心在于“大家在彼此的基础上不断进步”。

竞争白热化:DeepSeek已被曝瞄准2026年春节档,准备发布更强的新模型。

开源之争:Mistral 也在持续更新其Devstral家族,试图夺回开源编程智能体的高地。

这场“口水仗”背后,反映出全球顶尖 AI 实验室在技术迭代速度上的极度焦虑。在代码与公式面前,单纯的口头宣誓往往无力,真正的胜负终将在模型性能的实测中揭晓。

via AI新闻资讯 (author: AI Base)
👑 专家评特朗普“新王室”外交:以个人利益取代国家利益

政治学者 Stacie Goddard 与 Abraham L. Newman 在《纽约时报》撰文指出,特朗普的外交政策并非传统的“大国竞争”,而是一种类似于 16 世纪的“新王室主义”。该模式将外交政策工具化,核心目标是为特朗普及其亲信圈子获取金钱与地位,导致国家利益被精英阶层的私利所取代。文章提到,特朗普的“宫廷圈子”由马可·卢比奥、埃隆·马斯克、史蒂夫·威特科夫及贾里德·库什纳等亲信组成,外交决策权高度集中于这一排他性网络。

在具体行动上,特朗普对格陵兰岛的主权要求引发了丹麦与法国等盟友的困惑。在委内瑞拉问题上,特朗普宣布控制 5000 万桶原油,而其大捐助者保罗·辛格旗下的公司则获得了委内瑞拉在美石油子公司 Citgo 的控制权。贸易政策方面,关税被视为向各国及企业索取“贡品”的手段,例如越南在寻求关税减免的同时批准了特朗普家族价值 15 亿美元的高尔夫球场项目。此外,在特朗普扭转英伟达对阿联酋的芯片出口禁令前,阿联酋支持的投资者向特朗普家族关联的加密货币公司注资了 20 亿美元。

作者警告,这种基于榨取和支配的秩序正在侵蚀以规则为基础的国际体系。尽管部分国家选择通过赠送金礼或赞美来换取短期利益,但加拿大总理马克·卡尼等领导人呼吁各国建立多边替代方案,通过加强欧盟与南方共同市场的贸易整合及提升欧洲防务独立性,以抵御这种“新王室主义”的扩张。文章强调,这种模式的本质是少数人的榨取,而非多数人的安全与繁荣。

(NYT > China)

via 茶馆 - Telegram Channel
全球首创:京东购物智能体 JoyGlance 正式登陆乐奇 AI 眼镜

1月26日,京东科技旗下购物智能体 JoyGlance 正式上线智能眼镜头部品牌乐奇 Rokid,标志着全球首款智能眼镜购物应用进入实际可用阶段。此次上线是双方在2025年底官宣战略合作后的全面能力打通。

通过将 JoyAI 大模型的意图识别、智能搜品能力与Rokid的光波导显示及语音交互深度融合,智能眼镜已升级为全新的 AI 购物入口。

● 交互简化: 用户只需通过简单的语音指令(如“乐奇,帮我搜同款”)即可识别商品。
● 高效流程: 购物流程从传统的“搜索、浏览、比价、下单、支付”简化为极致的“说、看、付”。

在支付环节,JoyGlance 采用了“语音识别 + 声纹识别”的金融级安全方案。该方案能有效防范录音攻击和声纹合成风险,在确保自然交互体验的同时,为用户的资金安全提供了坚实保障。

via AI新闻资讯 (author: AI Base)
腾讯“元宝派”开启内测:AI 深度潜入微信、QQ 社交圈

腾讯旗下 AI 助手“元宝”今日低调开启了全新社交玩法“元宝派”的内部测试。作为腾讯在 AI 领域的一次关键创新,“元宝派”旨在探索 AI 技术在多人社交场景下的深度融合,致力于打造一个让 AI 与用户群体共同娱乐、协作的全新“社交空间”。这一动作标志着腾讯正将 AI 的应用方向从单一的效率工具,延伸至连接人与人、增进群体互动的社交属性。

在核心玩法上,“元宝派”赋予了 AI 极强的参与感。用户可以自由创建或加入不同的“派”,并直接在群内 @元宝 总结聊天要点,或引用其回复。此外,元宝 AI 还能化身“监督员”,协助用户发起健身、阅读等兴趣打卡活动。除了文字交互,派内还支持“图片二创”功能,让用户能将普通照片快速转化为有趣的梗图或表情包,在共同创作中激发社交乐趣。

技术底层方面,元宝派展现了腾讯跨产品协作的深度。据悉,后续公测将上线基于腾讯会议音视频能力的“一起看”和“一起听”功能。该玩法允许用户邀请派内好友同步观看电影、球赛或聆听音乐。通过引入专业级的音视频底层技术,腾讯试图在 AI 社交空间内重构沉浸式的多人协同娱乐体验,让 AI 真正融入用户的日常生活场景。

为了实现用户增长的“丝滑”过渡,元宝派与微信、QQ 等国民级社交产品深度打通。用户可以通过分享“派号”或专属链接,邀请微信和 QQ 好友一键加入。在此之前,元宝已实现了在社交平台内的多点触达:用户不仅能将“元宝”添加为好友随时互动,还能在公众号、视频号评论区通过 @元宝 快速总结内容或进行拓展提问。

从行业视角看,腾讯此举无疑是将 AI 战局拉进了自己最擅长的“社交场”。通过“元宝派”,腾讯试图打开一种全新的人与 AI 交互模式,即 AI 不再仅仅是冷冰冰的问答机器,而是能够润滑人际关系、提升群体活跃度的社交参与者。这种尝试为当前同质化严重的大模型应用市场提供了一个基于社交关系链的“新解题思路”,也预示着社交 AI 时代的全面到来。

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]