
2月18日,昆仑万维开源中国首个面向AI短剧创作的视频生成模子SkyReels-V1、中国首个SOTA级别基于视频基座模子的脸色行为可控算法SkyReels-A1。
开源地址:
1、SkyReels-V1:https://github.com/SkyworkAI/SkyReels-V1
2、SkyReels-A1:https://github.com/SkyworkAI/SkyReels-A1
3、时代论述:https://skyworkai.github.io/skyreels-a1.github.io/report.pdf
4、SkyReels官方地址:skyreels.ai
1. SkyReels-V1:Human-Centric Video Foundation Model,中国首个面向AI短剧创作的开源视频生成模子
SkyReels-V1可杀青影视级东说念主物微脸色饰演生成,相沿33种紧密东说念主物脸色与400+种当然行为组合,高度报告真情面感抒发。正如以下视频所示,SkyReels-V1相沿生成大笑、咆哮、诧异、哽噎等微脸色,展现出东说念主物表情丰沛的饰演细节。即使有大幅度肢体行为,SkyReels-V1生成的微脸色也无缺贴合东说念主物肢体饰演。
同期,SkyReels-V1为AI视频生成带来了电影级光影好意思学,基于好莱坞级的高质地影视数据试验,现时SkyReels生成的每一帧画面,在构图、演员站位、相机角度等王人具备电影级的质感。不管是单东说念主镜头饰演细节,仍是多东说念主构图,现时已具备精确的脸色放胆和高质感画面。
更进击的是,SkyReels-V1不仅相沿文生视频、还能相沿图生视频,是开源视频生成模子中参数最大的相沿图生视频的模子,在同等分袂率下各项谋略杀青开源SOTA。
图1丨SkyReels-V1文生视频谋略对比(开始:昆仑万维SkyReels)
或者杀青这么的SOTA级别,不仅依赖于昆仑万维SkyReels团队基于自研的高质地数据清洗和东说念主工标注管线,构建了千万级的高质地电影&电视剧&记录片数据。更依托团队自研「Human-Centric」的视频通晓多模态大模子,大幅晋升视频中东说念主物关联的通晓才气,尤其是自研东说念主物智能剖判系统。
要而言之,收成于塌实的数据服务和先进的东说念主物智能剖判系统,SkyReels-V1不错杀青:
影视化脸色识别体系:11种针对影视戏剧中的东说念主物脸色通晓,如不屑、不耐性、无助、厌恶等脸色的通晓;
东说念主物空间位置感知:基于东说念主体三维重建时代,杀青对视频中多东说念主的空间相对干系通晓,助力模子生成影视级东说念主物站位;
活动意图通晓:构建朝上400种活动语义单位,杀青对东说念主物活动的精确通晓;
饰演场景通晓:杀青东说念主物-服装-场景-剧情的关联分析。
SkyReels-V1不仅是全球小数数开源的视频生成模子,仍是围绕东说念主物饰演、开源视频生成模子中性能最强的。
在自研推理优化框架「SkyReels-Infer」的加抓下,大幅晋升推理效果,杀青544p分袂率,推理基于单台4090只需80s,还相沿散布式多卡并行,相沿Context Parallel,CFG Parallel,和 VAE Parallel。此外,给与fp8 quantization以及parameter-level offload,夸耀低显存用户级显卡运转需求;相沿flash attention、SageAttention,模子编译优化等,进一步优化蔓延;基于开源diffuser库,晋升易用性。
正如下图2所示,在同等RTX4090资源情况下对比(4卡),SkyReels-Infer版块比HunyuanVideo官方版块端到端蔓延减少58.3%(293.3s vs 464.3s);SkyReels-Infer版块具备更鲁棒的部署政策,相沿用户级别显卡1卡-8卡的推理部署。
图2丨推理生成544p视频,使用调换卡数的RTX 4090,SkyReels-Infer版块端到端蔓延优于HunyuanVideo官方(xdit) 58.3%
在同等A800资源情况下对比,SkyReels-Infer版块比HunyuanVideo官方版块端到端蔓延减少14.7%~28.2%(如图3所示),SkyReels-Infer版块具备更鲁棒的多卡部署政策。
图3丨推理生成544p视频,SkyReels-Infer版块具备更鲁棒的多卡部署政策,相沿8卡部署
2.SkyReels-A1:首个SOTA级别的基于视频基座模子的脸色行为可控算法
为了杀青愈加精确可控的东说念主物视频生成,昆仑万维还开源了SOTA级别的基于视频基座模子的脸色行为可控算法SkyReels-A1,对标Runway的Act-One,SkyReels-A1相沿视频驱动的电影级脸色捕捉,杀青高保真微脸色报告。或者基于大肆东说念主体比例(包括肖像、半身及全身构图)生成高度传神的东说念主物动态视频,其信得过感源自对东说念主物脸色变化和心情的精确模拟、皮肤肌理、身体行为奴婢等多维度细节的深度报告。
SkyReels-A1不仅相沿侧脸的脸色放胆生成、还能杀青愈加传神的眉眼微脸色生成和更大幅度的头部与当然身体行为。SkyReels-A1或者杀青更大幅度的东说念主物脸色驱动。比较Runway的Act-One,SkyReels-A1不错移动更复杂的脸色行为,生成的东说念主物面部表情不错妥洽肢体及画面本色杀青更活龙活现的饰演。
3.以开源之姿,以破局之势,昆仑万维勤劳于鼓励全球AI短剧创作生态茁壮发展
昆仑万维一直坚抓开源,鼓励时代平权。昆仑万维同期将SOTA级别的SkyReels-V1和SkyReels-A1进行开源,是AI短剧行业首例,亦然昆仑万维SkyReels回馈行业迈出的一小步,更是促进AI短剧创作和视频生成行业枝繁叶茂的一大步。
咱们服气在进行推理优化的升级和可控算法的开源后,它们将为用户带来低本钱、可控性更强的AIGC才气。昆仑万维但愿通过更多优秀视频生成模子的开源和极致的AI短剧居品才气,为用户带来低本钱杀青AI短剧创作的可能性、冲破行业现在视频生成一致性差的问题,让众人通过我方的电脑生成精细且可控的东说念主物饰演。
这次开源的视频大模子,不仅是一次时代冲破,有助于放松全球本色产业的数字鸿沟,更是文化产业出产力的一次翻新。往日,短剧与游戏、诬捏施行等领域的跨界发展,将会加快产业会通。AI短剧也有但愿从“时代实验”迈向“主流创作”,成为全球文化输出的新载体。
“杀青通用东说念主工智能,让每个东说念主更好地塑造和抒发自我”是公司的责任,往日,昆仑万维及SkyReels还将开源更多视频生成模子和算法、通用模子赌钱赚钱官方登录,通过开源杀青AGI平权,鼓励AI短剧生态的抓续诞生和茁壮,促进开源社区、迷惑生态以及AI行业的发展。