腾讯发布混元图像3.0图生图模型:语义理解驱动,“一句话”实现精准修图

1月26日,腾讯混元正式发布其最新的**混元图像3.0图生图(HunyuanImage3.0-Instruct)**模型。该模型补齐了混元在图像编辑与多图融合领域的重要版图,目前已在腾讯元宝全端及官网同步上线。

80B 参数巨兽:会思考、懂指令的图像编辑

混元图像3.0图生图模型总参数量达80B(激活参数约13B),采用先进的混合专家(MoE)架构。与传统修图工具不同,该模型具备卓越的语义理解与推理能力:在接收到图片和提示词后,它会先分析图像内容并拆解编辑步骤,精准识别需要修改与保留的区域。

依托于千万量级的图生图数据及自研 MixGRPO 算法,模型在保持非编辑区域一致性、指令响应速度以及真实感表现上均有显著提升。

全场景覆盖:从老照片修复到多图合照

该模型支持80余种细分任务,为用户提供多样化的创作能力:

● 图片精修: 支持对光线、皮肤及背景进行增删改,甚至可在不破坏布局的情况下修改图片中的文字。
● 风格变换: 实现真人变漫画、像素风格转化或老照片修复。
● 深度融合: 支持提取多张照片中的人物或元素,快速合成全新的合照或创意图片。

目前,用户可以通过腾讯元宝体验 AI 制作表情包、虚拟合拍及电商海报设计等功能。这标志着大模型 P 图正式进入“意图驱动”的高效时代。

via AI新闻资讯 (author: AI Base)
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]