字节“随变”上手体验:快速生成情感短视频,但长视频能力待提升。Sora仍是标杆,Oiioii创意落地快。
原文标题:Sora的对手来了?我们实测了字节新品”随变” | 模力工场
原文作者:AI前线
冷月清谈:
怜星夜思:
2、Sora在物理世界的模拟上具有明显优势,但情感表达略显不足,你认为AI视频生成在情感表达方面还有哪些提升空间?
3、文章提到Oiioii在宏大场景和镜头语言上颇具想象力,但细节逻辑存在错误,你认为在AI视频生成中,宏观创意和细节把控哪个更重要?
原文内容
Sora的对手来了?
我们实测了
字节新品”随变”
2026 January.
“随变” 来了
作为每天 5Ga 冲浪的抖音资深用户,本小A必然不能错过这新的玩法!
打开「随变」第一眼:好家伙,界面完全是抖音那味儿——只是顶上只剩“关注”和“推荐”俩标签。
仔细一看,抖音那些花里胡哨的滤镜全被阉割掉了,只留下两个入口:创作和合拍。
不同于Sora的文生视频形式,在使用「随变」之前,你需要给自己捏一个 AI 形象——作为”你在随变里的数字分身”。
左右滑动查看更多
点开创作功能,它提供了图片、动图和视频三种格式。仔细一看,里面集合的模板挺眼熟的——像蓝调摄影滤镜、渐变色光影这些热门滤镜,还有粘土风、治愈日漫风这类在小某书上很火的风格,甚至“变身”“帅哥来抱我”这类视频模板也都有。感觉上,它和「剪映」在功能和模板上确实有不少重叠。
(图源随变AI生成)
合拍这一点做得挺有意思的。只要我捏出专属形象,就能和一些经典角色——比如企鹅或蒙娜丽莎——搭在一起,组个CP,玩出点互动感。
它还提供了一些预设的提示词模板,像是过年相关的“包饺砸🧨”,或者“企鹅跳舞”这种简单场景。
场景测试
除此之外,「模力工场测评团」还拉来了 Sora 等国内外热门的 AI 视频工具,给「随变」来了场硬核的“横向测评”。本次测评将围绕两个场景、三个核心维度展开,测试「随变」的 AI 生视频能力。
场景一:动作合理性与流畅度
prompt:
以照片中的人物为创作对象。画面一开始,他站在原地,神情冷静而克制,身体微微前倾,周围气氛紧张。随后他猛地甩出金箍棒,动作有力量但不过分夸张。而后顺势腾空而起,向远处飞去,镜头跟随他短暂上升,然后停留在原地,看着他消失在空中。整体画面偏电影感,动作连贯,避免夸张特效和卡通化表现。
▲随变表现
▲Sora表现
▲Oiioii表现
场景二:复杂叙事理解与形态转换的想象力
prompt:
画面从远景开始:悟空独自站在荒废的古战场中央,环境阴暗而厚重,残破的石像与风沙围绕四周,整体气氛压抑而肃穆。
镜头缓慢向前推进,逐渐拉近到中景与近景。在推进过程中,悟空始终保持沉默,但他的气质在悄然变化:从压抑、疲惫的人性状态,逐渐显露出属于猴的野性与警觉。
随后,悟空缓缓睁开双眼,目光由混沌转为清醒,仿佛记忆被唤醒。此刻无需夸张特效,只通过眼神与姿态传达齐天大圣的神性回归。
最后,悟空转身踏出一步,身形在远处的风沙中逐渐模糊,画面停留在未完成的觉醒状态,整体保持写实、电影感,避免卡通化与过度特效。
▲随变表现
▲Sora表现
▲Oiioii表现
实测结论
模力工场测评团通过实际测评,将这三款应用的能力维度作如下拆解:
· 随变:情感渲染大师
优势:
1. 在人物微表情、情绪递进上表现惊艳。
2. 10秒级生成速度重新定义了用户预期,契合短视频消费节奏。
3. 零门槛无缝上手,完全继承抖音交互逻辑,用户无需任何学习即可直观操作。
劣势:
-
多指令执行完整度不够,牺牲了一些复杂动作合理性、场景连贯性。
-
难以支撑复杂叙事和长片创作,工具属性大于创作平台属性。
· Sora:专业创作的“预可视化引擎”
优势:
-
物理世界的优等生:在动作流畅性、物体运动轨迹和物理合理性上具有断层式领先。
-
复杂叙事的理解者:能较好理解并执行包含多步骤、场景转换的长文本指令。
-
画面质感的保障:输出视频的稳定性、一致性和电影感画质处于行业第一梯队。
劣势:
-
情感表达略“机械感”,微表情不够细腻。
-
生成耗时较长,无法满足即时分享的冲动。
-
使用门槛存在,需科学上网。
· Oiioii:创意快速落地的“快剪导演”
优势:
-
在生成宏大场景、氛围渲染和镜头语言(如远景切换)上颇具想象力,能快速搭建出“故事感”画面。
-
独创“快速生成”与“故事短片”双模式,结合分镜编辑与自动音频生成。
-
适合用于快速脑暴、概念可视化及对完整性和效率要求高于细节精度的创作。
劣势:
-
细节逻辑有误,在物体互动、手部细节、空间关系上频繁出现明显错误。
-
生成质量不稳定:复杂视频生成速度慢,且质量波动较大,“开盲盒”属性较强。
END.
小程序
模力工场










