昆仑万维 SkyReels-V3开源,实现多模态视频生成技术突破

1月29日,昆仑万维(Skywork AI)宣布正式开源其自研的“全能型”视频生成大模型——SkyReels-V3。 该模型的发布标志着视频生成技术进入了高保真、多模态的新阶段,通过单一建模架构实现了参考图像转视频、视频延长以及音频驱动虚拟形象三大核心能力的深度集成。

在**参考图像转视频(I2V)**领域,SkyReels-V3支持1至4张参考图输入,能够精准保留主体身份特征与空间构图。测评数据显示,其在参考一致性与视觉质量指标上均表现出色,超越了 Vidu Q2和 Kling1.6等主流商用模型。

针对视频创作中的时长与叙事痛点,SkyReels-V3推出了强大的视频延长功能。该功能不仅支持简单的视角延续,更引入了“镜头切换延长模式”,内置切入、正反镜头等专业电影转场技术,使 AI 生成视频从简单的“时间扩展”进化为具备逻辑的“叙事扩展”。

此外,**音频驱动虚拟形象(Talking Avatar)**模块通过精准的音视频对齐技术,实现了极高的口型同步率,并支持分钟级长视频生成及多角色交互,为数字人直播和在线教育提供了更自然的交互体验。

目前,SkyReels-V3已在 GitHub 正式开源,并提供限时免费的 API 调用服务。昆仑万维表示,将继续深耕“All in AGI 与 AIGC”战略,通过开源推动 AI 视频创作生态的繁荣。

地址:GitHub:https://github.com/SkyworkAI/SkyReels-V3

via AI新闻资讯 (author: AI Base)
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]