全球最强开源图生图!腾讯混元图像3.0正式开源,800亿参数助力 AI 创作

紧随“元宝春节10亿红包”活动的火热开启,腾讯混元团队于1月28日正式宣布,开源其最新的 混元图像3.0图生图模型 (HunyuanImage3.0-Instruct)。该模型凭借800亿总参数规模(激活参数约13B)的混合专家架构(MoE),在 LMArena 全球影像编辑榜单中位列第七,跻身第一梯队,成为目前全球最强的开源图生图模型。

核心技术突破:“先思考,后编辑”。 混元图像3.0采用了原生多模态架构,将文本与视觉理解深度融合。模型通过千万量级数据及思维链(CoT)注入,学会了在执行任务前先分析图像内容与用户意图,从而生成精准的编辑指令。配合自研的 MixGRPO 算法,模型在指令遵循及保持非编辑区域一致性方面表现卓越。

全能编辑体验与多场景赋能。 该模型支持增删改、风格变换、人物与文字修改、老照片修复及多图融合等多种花式玩法。对于普通用户,它是表情包制作与社交分享的神器;对于专业设计师,它能显著提升电商海报和游戏角色定制的创作效率。

全面拥抱开源社区。 目前,腾讯混元已将该模型的权重及完整代码托管至GitHub和Hugging Face。除标准版外,还同步推出了蒸馏版模型,以降低开发者的使用门槛。开发者与研究者现可直接获取这些资源,基于此强大的基础平台进行应用研发与二次开发。

官网体验:https://hunyuan.tencent.com/chat/HunyuanDefault?from=modelSquare&modelId=Hunyuan-Image-3.0-Instruct

via AI新闻资讯 (author: AI Base)
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]