可灵支持生成长达 2 分钟的 30 帧视频,分辨率最高 1080p,自由定制宽高比。与 Sora 不同的是,可灵发布即上线,公众现在可以直接在快影 APP (AI创作-AI视频生成) 中申请体验。
可灵整体框架采用了类 Sora 的 DiT 结构,用 Transformer 代替了传统扩散模型中基于卷积网络的 U-Net。快手大模型团队还自研了一款 3D 时空联合注意力模块和 3D VAE 网络,以实现更好的时空运动建模与更高效的隐空间编/解码。
量子位
关注频道 @ZaiHuaPd
频道爆料 @ZaiHuabot
Video is too big
via 软件新闻频道📮在花投稿 - Telegram Channel