实测7款「Sora级」视频生成神器,谁有本事登上「铁王座」?
作者: 机器之能 来源: 机器之能
机器之能报道
编辑:杨文
谁能成为AI视频圈的King?
美剧《权力的游戏》中,有一把「铁王座」。
传说,它由巨龙「黑死神」熔掉上千把敌人丢弃的利剑铸成,象征着无上的权威。为了坐上这把铁椅子,各大家族展开了一场场争斗和厮杀。
而自 Sora 出现以来,AI 视频圈也掀起了一场轰轰烈烈的「权力的游戏」,这场游戏的玩家主要有大洋彼岸的 Runway Gen-3、Luma,国内的快手可灵、字节即梦、智谱清影、Vidu、PixVerse V2 等。
今天我们就来测评一下,看看究竟谁有资格登上 AI 视频圈的「铁王座」。
-1-
文生视频
目前,文生视频功能已经是各家 AI 视频产品的「拿手好戏」,我们就把它当个开胃菜。
Prompt 1: The camera directly faces colorful buildings in Burano Italy. An adorable dalmation looks through a window on a building on the ground floor.
中文提示词 1: 镜头直接对着意大利布拉诺五颜六色的建筑,一只可爱的斑点狗从一楼的窗户往外看。
可灵:
即梦:
清影:
Vidu:
PixVerse V2:
Luma:
Runway Gen-3:
各家都生成了五颜六色的建筑,从运动幅度以及画面的精美程度来看,Runway Gen-3 效果最佳,其次可灵和即梦也挺丝滑。
Prompt 2: Nighttime footage of hermit crabs using light bulbs as shells.
中文提示词 2: 寄居蟹用灯泡做壳的夜间镜头。
可灵:
即梦:
清影:
Vidu:
PixVerse V2:
Luma:
Runway Gen-3:
大部分视频中,要么是寄居蟹动几下钳子,要么就是摇镜头,相对而言, Vidu 和 Runway Gen-3 的视频运动幅度最大。Vidu 生成的视频中,寄居蟹一溜烟都快跑没影了, Runway Gen-3则展示了寄居蟹爬动的过程。
Luma 的寄居蟹长得最奇怪,圆滚滚的,有点像满地爬的蟑螂。
Prompt 3: The story of a robot’s life in a cyberpunk setting.
中文提示词 3: 一个机器人在赛博朋克背景下的生活故事。
可灵:
即梦:
清影:
Vidu:
PixVerse V2:
Luma:
Runway Gen-3:
除了 Luma 没有出现像样的机器人外,其他各家都展示了各自想象中的机器人形象。
可灵生成的视频画面,在构图和镜头上神似 Sora 放出来的「东京女子走在街头」的示例;即梦的画面最为精美和赛博朋克,而 Vidu 则有种科幻片的即视感; PixVerse V2 的机器人最怪异,像顶了个水桶脑袋。
要说逼真程度以及运动幅度,Runway Gen-3 的效果似乎更胜一筹,当然它也有 bug,比如凭空出现并向后疾驰的汽车。
Prompt 4: The waves are lapping against the shells on the beach.
提示词 4: 海浪拍打着沙滩上的贝壳。
可灵:
即梦:
清影:
Vidu:
PixVerse V2:
Luma:
Runway Gen-3:
整体来说,可灵和即梦生成的效果最真实,Luma 的贝壳看起来有点变形,最离谱的是 PixVerse V2,一开始画面还算正常,但眨眼功夫跑出来一个人,面部表情以及手部崩得没眼看。
Prompt 5: Cartoon style, a kangaroo is dancing
提示词 5: 卡通风格,一只袋鼠在跳舞。
可灵:
即梦:
清影:
Vidu:
PixVerse V2:
Luma:
Runway Gen-3:
AI 理解的动漫风格的袋鼠可真是五花八门,有像老鼠的,也有像不明物种的。相比而言,可灵、Vidu 和 Runway Gen-3 效果更佳,起码没有大面积的模糊虚化。
**-2-
图生视频
这几家号称对标 Sora 的视频生成模型也均上线了「图生视频」功能,只需上传一张图片,输入提示词就可让静态图片动起来。
Round 1
上传一张皮卡丘的图片,输入提示词:皮卡丘开心地蹦起来(It jumps up happily)。
可灵:
即梦:
清影:
Vidu:
PixVerse V2:
Luma:
Runway Gen-3:
这轮 Vidu 完胜,不仅运动幅度大,表情、动作流畅,而且蹦跳的过程画面没垮;只是没想到,这轮效果最差的是 Runway Gen-3,各种稀奇古怪的变形。
Round 2
上传一张格兰特・伍德著名的油画《美国哥特式》,输入提示词:两个人笑了起来(They laugh)。
可灵:
即梦:
清影:
Vidu:
PixVerse V2:
Luma:
Runway Gen-3:
从表情的自然程度来说,这把我选 Runway Gen-3、可灵和 Vidu,你觉得呢?
**-3-
小编有话说
Runway 不愧是 AI 视频圈的「扛把子」,Gen-3 着实能打,除了皮卡丘翻车以外,其他测试均表现不错。
其次就是可灵,生成画面比较稳定,对于提示词的遵循也挺到位。
即梦对于颜色的驾驭最强,它生成的视频颜色搭配最舒服,不足之处就是当动作幅度过大时,画面容易模糊变形。
Vidu 的动漫效果最好,很擅长把动漫角色动态化这类活儿,而且生成速度快,生成一段 4 秒的视频仅需 30 多秒钟。
Luma,这个曾一度让全球网友疯狂的整活工具,在此次实测中,相比于可灵和 Runway Gen-3,它的表现并不突出,而且生成速度极慢,有时候一段 5 秒的视频得花半个多小时,甚至更长时间。
从付费情况来看,目前除了 Runway Gen-3 需要完全付费外,其他各家都有免费体验次数。其中智谱清影处于内测阶段,可以免费无限次生成。
为满足不同用户的需求,各家把会员分为基础、标准和高级三种,价格都不便宜,按照年付来算,标价最贵的当属 Luma,基础会员每年都需 287.9 美元,这个价格在一众应用中,可以说是一骑绝尘了。
你觉得哪家AI视频生成能力最强?评论区聊聊吧。
工具链接:
快手可灵:https://klingai.kuaishou.com/
字节即梦:https://jimeng.jianying.com/ai-tool/home?activeTab=video&subTab=video
生数Vidu:https://www.vidu.studio/
智谱清影:https://chatglm.cn/video
PixVerse:https://pixverse.ai/
Luma:https://lumalabs.ai/dream-machine
Runway Gen-3:https://runwayml.com/
以后我们会带来更多AI大模型、AI应用的一手评测,也欢迎大家进群交流。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
更多AI工具,参考Github-AiBard123,国内AiBard123