Vidu Q2 参考生 Pro:AI 视频进入“万物皆可参考”时代

Vidu Q2 参考生 Pro 发布,首创「万物可参考」视频模型,让 AI 视频创作进入高可控时代。

原文标题:万物皆可参考是种什么体验?Vidu Q2参考生Pro:特效、演技、细节全都要

原文作者:机器之心

冷月清谈:

Vidu Q2 参考生 Pro 的发布,标志着 AI 视频生成从追求画质到追求可控性的转变。它实现了全球首个「万物可参考」的视频模型,打破了图片参考的局限,支持视频参考,能够一键迁移百万级的电影特效、细腻的微表情和复杂的流体纹理。同时,它还支持视频编辑,可以精准地增、删、改、减视频内的元素,让视频编辑告别了不可预测的抽卡。Vidu Q2 参考生 Pro 的出现,降低了影视创作的门槛,提升了制作效率,让创作者能够更好地掌控视频内容,实现了创作自由的回归。总的来说,它代表着 AI 视频生成技术正在从“有没有”向“精不精”发展,是 AI 视频创作领域的一次重要升级。通过视频参考和编辑功能,Vidu Q2 参考生 Pro 让创作者能够更精准地控制视频内容,摆脱了对 AI 随机性的依赖。

怜星夜思:

1、Vidu Q2 参考生 Pro 提出的“万物皆可参考”会给影视特效行业带来哪些变革?传统特效师会因此失业吗?
2、Vidu Q2 参考生 Pro 在情绪和细节的捕捉上有了很大的突破,你觉得AI生成的虚拟角色,未来有可能取代真人演员吗?
3、文章提到 Vidu Q2 参考生 Pro 让创作自由回归,你认为 AI 视频生成技术,最终会让内容创作者更依赖技术,还是摆脱技术束缚?

原文内容

图片
编辑|+0


最近,一段「威尔·史密斯吃意面」的今昔对比视频在社交媒体刷屏,引发了无数感慨。



两年前,初出茅庐的 AI 视频还是「抽象鬼畜」的代名词,五官乱飞、逻辑崩坏;仅仅两年过去,当同一主题再次被演绎,从吞咽时肌肉的牵动,到光影在面部的细腻流转,AI 已进化至「惟妙惟肖」的真·智能水准。


这两年,浓缩了 AI 视频生成行业翻天覆地的技术跃迁。然而,行业并未止步于画质的内卷。在各家厂商竞逐「可控性」高地的当下,AI 视频正站在一个关键转折点:从解决「有没有」,到追求「精不精」


回顾 Vidu 的进化之路:2025 年 9 月,Vidu Q2 全球首发,以惊艳的图生视频、参考生视频能力技惊四座;12 月,Q2「生图全家桶」上线,首日突破 50 万次的使用量,印证了市场对高质量生成的渴望。


昨天,Vidu Q2 参考生 Pro 正式发布。


登陆 Vidu.cn 或 Vidu API:platform.vidu.cn,体验最新产品功能。


短短数月,它完成了从「生成」到「编辑」的闭环,更推出了全球首个「万物可参考」的视频模型,将参考模态从静态图像一举扩展至动态视频与多维元素。其全新 Slogan「视频参考,创想无限」,不再是一句营销口号,而是对 AI 视频生产流的一次底层重构。


此次更新带来了两大功能亮点,重新定义了 AI 的「模仿」与「创造」:


  • 视频参考:特效与演技的「万能格式刷」

Vidu Q2 参考生 Pro 不仅极大丰富了参考类型(涵盖人物、场景、特效、表情、动作、材质纹理等),更在模态上实现了质的飞跃。


作为全球首个「万物可参考」的视频模型,它打破了图片的束缚,能同时处理多段视频素材。只需输入参考视频,无论是百万级的电影特效、细腻的微表情,还是复杂的流体纹理,都能实现一键迁移。它能精准拿捏细微情绪,让演技自然可信,让特效落地生根。


  • 视频编辑:不再「牵一发而动全身」

基于强大的视频参考能力,Vidu 让视频编辑告别了不可预测的抽卡。


Vidu Q2 参考生 Pro 支持对视频内元素的精准增、删、改、减:从改变人物站位、调整画幅比例,到更换背景、美颜美发,甚至进行复合编辑,均可通过参考指令一键达成。得益于支持 2 个视频 + 4 张图片的多模态高并发输入能力,即便历经多次复合编辑,视频的核心元素与画面一致性依然稳如磐石。


话不多说,我们直接上手体验。


从「抽卡」到「精修」,

这回是真的吗?


Slogan 里的「视频参考」到底成色几何?为了验证它是否真能让人一键化身「AI 影帝」并拥有随心所欲的控制力,我们设计了三个测试场景,实测它在多视频参考与细节增删上的真实表现。


场景一:一键复刻,演技与特效的「神形合一」

动作捕捉和百万特效并不是新鲜事,还记得《阿凡达》拍摄时,卡梅隆是用怎样复杂的设备与调度才完美呈现了纳美人的世界吗?此前 AI 往往只能捕捉大概的肢体动作,一旦涉及到人物外观的剧烈变形或特效加载,一直是灾难现场(参考两年前的威尔·史密斯)。


先看官方演示:让指定人物完美复刻《X 战警》中魔形女的变身过程。


输入:


图片


输出:


图片


这效果,只能说「百万特效一键白嫖」真不是吹的。这不仅是视觉层面的「高保真」,更是对传统特效制作逻辑的降维打击。


以往需要专业团队耗时数周、燃烧经费才能实现的流体变形与高精特效,如今被 Vidu Q2 参考生 Pro 压缩至边际成本几近归零。这种生产力的跃迁,意味着影视创作将告别「唯预算论」的旧时代。当工业级特效不再是昂贵的奢侈品,创作者的想象力,将成为衡量作品价值的唯一天花板。


那 AI 的演技如何呢?我们玩个大的,让 Vidu 挑战张曼玉在《甜蜜蜜》中的经典哭戏。


我们上传了原片作为参考,要求生成的虚拟角色复刻这一瞬间: 


图片


输出:



有一说一,AI 复刻得相当传神,眉眼间的情绪流转非常到位。


这种高精度的神态捕捉与生成能力,若应用到具体产业,将极大拓展制作流程的想象空间。对于短剧市场而言,这意味着创意的可视化门槛被进一步降低。创作者可以利用技术手段,将抽象的剧本快速转化为情绪饱满的视觉素材,让好的故事不再受限于初期制作条件的简陋。


在影视制作前期,它能升级为更直观的 Previz(预演)工具,让导演在开机前就能看到带有情绪色彩的动态分镜,辅助艺术决策;而在动漫领域,这种技术或许能成为传统转描工艺的智能化升级,将真人表演的细腻韵律转化为特定画风的动画,助力跨次元创作更高效地落地。


接下来是「多视频参考」的整活时间,我们同时上传沈腾老师和怪盗基德的经典片段。


图片
图片


让 Vidu 给人物换上沈腾老师的衣服并模仿他的动作,再配上怪盗基德的眼镜和帽子,看看喜剧之王和二次元男神会碰撞出什么火花:



输出:



效果肉眼可见的丝滑,手部动作完美复刻,镜片高光随着人物的头部晃动产生符合物理规律的动态反射,帽子边缘的遮挡关系也处理得严丝合缝,整体的服饰光影以及人物的神韵都维持了极高的统一度。


通过以上测试我们发现,这一次 AI 不仅「接住了戏」,更自带了百万级的特效光环。它不再只是机械地复制骨骼点位,而是展现了一种惊人的「表演-特效」同步率:在完美驾驭魔形女变身这种极高难度的流体与纹理形变的同时,它还能读懂参考视频中眉头微蹙、眼神流转等情绪代码。


对于创作者而言,这意味着你能同时驱动虚拟角色的皮囊与灵魂,跳过繁琐后期,真正实现「一人就是一支特效剧组」。


场景二:一键换纹理,万物皆可「换皮」

前面展示了 AI 对动态表演的驾驭,接下来看看视频生成的另一个核心命题:质感。


纹理本质上决定了视频画面的「味道」。在 Vidu Q2 参考生 Pro 中,参考生视频中的材质纹理迁移,意味着 AI 已经不再停留于简单的像素模仿,而是开始真正习得了一门「质感语言」。


它不是将一张贴图生硬地包裹在物体表面,而是理解了光线如何在不同材质上折射、粗糙度如何影响视觉反馈。这种能力的涌现,让 AI 视频从「看起来像」进化到了「感觉是真的」。


先看官方如何处理复杂的纹理:将一个普通的杯子瞬间「烧制」成青花瓷。


图片
图片


可以看到,青花瓷特有的釉面反光与杯身曲面严丝合缝,毫无悬浮的「贴图感」,仿佛 AI 在数字世界里重新进行了一次物理建模。


切换整体风格也不在话下,比如瞬间变为粘土风:


图片
图片


那如果是我随手在宜家拍的一只毛绒小狗呢,Vidu 能否打破次元壁,随意改变它的世界?



我们先把这张静态照片交给 Vidu,让它生成一段基础视频:



可以看到,Vidu 不仅让小狗动了起来,更关键的是,它精准构建了画面的 3D 空间关系,不仅完美还原了周围环境,还保持了毛绒质感的稳定性。这为我们接下来的「魔改」打好了底子。


接着,我们尝试把小狗面前最大的碗换成蓝色的:



效果可以说是非常惊艳。AI 真正理解了物体的 3D 结构和光影关系,让这种「换皮」不再是简单的滤镜叠加,而是物理层面的重构。


场景三:一键精准修改,完美主义的救星

视频生成的构图和光影都很完美,偏偏主角没戴墨镜,或者背景里乱入了一个垃圾桶。


以前的解决办法?只能把 Prompt 改了又改,重跑 10 次模型,祈祷 AI 下一次能「蒙」对。Vidu Q2 参考生 Pro 这次更新的视频编辑功能直击痛点。


还是用前面宜家小狗的视频,我们试着要求删掉绿色的餐具,然后在蓝色碗里放一个苹果,看看效果怎么样:



可以看到,绿色的餐具被完美消除,蓝色碗中增加了一个看起来非常新鲜的苹果。


而在官方演示中,这种能力表现得更为惊人:


图片
图片


手指和手掌的结构一直是 AI 视频生成的「阿喀琉斯之踵」。在这个案例中,Vidu 不仅完美抹去了手机,更「脑补」出了被手机遮挡的手指细节和掌纹。这种感觉,就像是把 Photoshop 里的「橡皮擦」和「内容识别填充」搬进了视频里。


当然,客观地说,在实测中我们也发现,面对极度复杂的画面或混乱背景时,AI 偶尔也会出现变形或修补痕迹,但相比以前「这也变了、那也歪了」的崩溃体验,现在的可用性已经实现了从 0 到 1 的质变。


对于必须抠细节的创作者来说,这不仅是技术的进步,更是直接省掉了无数次「重新抽卡」的垃圾时间。


结语


小时候,我们都听过神笔马良的故事,那是人类最早关于「笔尖即现实」的浪漫幻想。而今,随着 AI 的进化,这个跨越千年的寓言正在我们指尖完成某种数字化的降临。


如果说过去两年的 AI 视频生成是一场凭运气拆盲盒的「概率游戏」,那么今天,这种充满随机性的浪漫正在退场。就像威尔·史密斯那碗意面终于变得优雅得体,技术正在从「野蛮生长」走向「颗粒度掌控」。


Vidu Q2 参考生 Pro 给出了一个很明确的信号:AI 视频的下半场,拼的不是运气,而是控制力。


当我们能够精准地拿捏情绪、增删元素,这支笔才真正算握在了创作者自己手中。这不仅仅是技术的进步,更是创作自由的回归:让机器服务于直觉,让每一个像素都听从大脑。


最后,马年快到了,给大家送上一个小「彩蛋」:让 Vidu Q2 参考生 Pro 请出《塞尔达传说》里的人马老师和林克,给大家拜个早年~


图片


🎁 福利时刻: 登录 Vidu.cn,输入邀请码:JQZX,注册即送 500 积分,开启你的「神笔」之旅!

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

我觉得冲击主要在人才结构上。传统影视行业需要大量特效师、剪辑师等,AI普及后,这些岗位的需求可能会减少,但同时也会出现新的岗位,比如AI视频生成工程师、Prompt工程师等。所以,影视从业者需要不断学习新技能,适应行业的变化。

控制力确实很重要,但我觉得更重要的是“理解力”。AI需要更深入地理解创作者的意图,而不是简单地执行指令。比如,理解创作者想要表达的情感、风格,甚至是隐藏的含义。这需要AI在自然语言处理、图像识别等方面有更大的突破。

那当然是想让 AI 彻底变成我的“私人订制”啦!我想要啥风格,它就能生成啥风格。最好能直接读取我的脑电波,直接把我想象的画面变成视频,这才是终极的“控制力”!

AI虚拟角色在某些特定场景下(例如:不需要复杂情感表达的广告、游戏等)可能会成为真人演员的有效补充,降低制作成本。但是,在需要深度情感投入和复杂角色塑造的影视作品中,真人演员的表演依然具有不可替代性。表演的魅力在于其独特性和不可预测性,观众观看的不仅仅是剧情,更是演员对角色的理解和诠释。

从技术角度来看,“万物皆可参考”无疑会加速特效制作流程的自动化,降低制作门槛和成本。但特效行业的核心竞争力在于创意和审美,AI目前还无法完全取代人类的艺术判断。特效师可能会更多地转向前期概念设计、流程优化和后期精修等方面,与AI协同工作,提升整体效率。完全失业的可能性不大,但需要不断学习和适应新技术。

The potential for AI-generated virtual characters to supplant human actors hinges on ongoing advancements in emotional nuance and realism. While AI excels at replicating technical aspects of performance, human actors possess an innate ability to connect with audiences on an emotional level, drawing upon personal experiences and improvisational skills to imbue characters with authenticity and depth. The entertainment industry is also built strongly on parasocial relationships, which may be hard to achieve without an actual person.

那可太有意思了,这玩意儿要是真能把特效成本降下来,以后小成本制作也能做出大片效果了!不过传统特效师应该不至于失业,感觉他们会转型成AI特效的“调教师”,毕竟AI再强也得有人告诉它该怎么做,对吧?万一AI抽风了,还得靠老师傅们救场啊,哈哈哈!

取代真人演员?我觉得有点悬。AI再厉害,也演不出那种发自内心的真实感。而且,追星女孩们追的是活生生的人啊,谁会喜欢一个冷冰冰的AI爱豆呢?除非AI能学会“塌房”,那样可能还有点话题度,哈哈哈!

AI video generation can liberate creators from technical constraints by automating tedious tasks and enabling rapid prototyping. However, over-reliance on AI could lead to homogenization of content if creators fail to leverage their unique artistic vision and critical thinking skills. Striking a balance between leveraging AI’s capabilities and nurturing human creativity is essential to ensuring a vibrant and diverse media landscape.

“万物皆可参考” potentially democratizes access to high-quality visual effects, enabling smaller productions and independent creators to achieve previously unattainable levels of cinematic polish. While specialized skills in areas like complex simulations and bespoke effects may still command a premium, the demand for generalist VFX artists could decline as AI handles more routine tasks. The key is for VFX professionals to upskill and integrate AI tools into their workflows, focusing on creative direction and problem-solving.

AI 视频生成技术的目标应该是赋能创作者,而不是取代他们。理想状态下,创作者可以利用 AI 快速实现想法,将更多精力投入到剧本创作、艺术指导和情感表达等方面,从而创造出更具深度和个性的作品。避免过度依赖的关键在于保持独立思考和创新能力,将 AI 视为一种工具,而不是创作的全部。