AI视频独角兽Synthesia:从百次拒绝到行业领导者的非凡之路与独特人才观

AI视频独角兽Synthesia,务实破局,以“反精英”用人哲学获英伟达、字节跳动青睐,估值破百亿。

原文标题:从被100家VC拒绝到英伟达、字节抢着投,AI视频独角兽CEO揭秘“奇葩”用人哲学:不招精英

原文作者:AI前线

冷月清谈:

Synthesia,一家AI视频初创公司,独辟蹊径,聚焦于让视频制作像PPT一样简单,而非盲目追求技术炫酷。公司在AI寒冬时期历经百次VC拒绝,最终凭借亿万富翁Mark Cuban的支持起步,坚持以解决实际问题为核心。其早期产品Studio已服务全球数十万家企业,最新推出的Synthesia 2.0更实现了表情丰富、可定制的个人AI头像。Synthesia的成功在于识别并服务那些有“反复应用场景”的真实用户,并灵活融合产品主导型增长(PLG)与企业销售模式。目前公司估值突破25亿美元,获得英伟达、字节跳动等巨头投资。值得一提的是,其CEO Victor Riparbelli实行“不招精英”的独特用人哲学,优先招聘那些拥有行动力、建设性思维,并在开源项目中展现韧性而非仅仅拥有光鲜履历的人才。 Synthesia的崛起,印证了务实解决用户痛点和非传统人才策略的强大力量。

怜星夜思:

1、文章中提到Synthesia的CEO Victor Riparbelli推崇“不招精英”的用人哲学,更看重行动力、建设性思维和在开源项目中的韧性。你们觉得这种用人策略真的适用于所有AI初创公司吗?它在实际操作中可能遇到哪些挑战或带来哪些意想不到的好处?
2、文章提到未来文字信息会越来越少,很多内容都可能以视频和音频形式被消费,甚至会融入VR和AR。除了Synthesia现在专注的企业级应用(如培训、营销),你认为Gen AI视频技术未来还能在哪些我们意想不到的领域改变我们的生活和工作方式?
3、Synthesia在增长策略上融合了“产品主导型增长(PLG)”与“企业销售型”两种模式,实现了从免费试用到企业客户的转化。对于其他AI基础技术或平台型公司来说,这种模式是通用的成功范式吗?在AI领域,这种模式有哪些独特性和挑战?

原文内容

作者|冬梅

AI 视频平台的发展史,几乎就是一部特效升级的编年史:从基础的文本转视频,到动态捕捉、场景生成,技术复杂度呈指数级攀升。这些复杂的技术背后,一个根本性问题却被多数人忽视:当企业 HR 需要制作员工培训视频时,当电商卖家想要快速生成产品介绍时,这些炫酷的技术究竟能带来多少实际价值?

当 Runway、MagicLight 等 AI 视频平台争相推出炫酷特效和复杂功能时,Synthesia 却选择了一条与众不同的道路。这家英国初创公司没有盲目追逐技术炫技,而是敏锐地捕捉到了一个最朴实的用户痛点:让视频制作变得像做 PPT 一样简单

近日,Synthesia 的联合创始人兼 CEO Victor Riparbelli 在 YouTube 平台分享了一段视频,讲述了他从怀揣一个疯狂的 AI 视频想法,到历经艰难创立 Synthesia 并将其发展壮大的创业历程。

历时 7 年,
靠着两代产品 ARR 冲到 7 亿多

Synthesia 由来自伦敦大学学院 (UCL)、斯坦福大学 (Stanford)、慕尼黑工业大学 (TUM) 和剑桥大学的 AI 研究人员和创业者团队于 2017 年创立。几位主要创始人为:Victor Riparbelli、Steffen Tjerrild、Lourdes Agapito 以及 Matthias Niessner。

值得一提的是,Matthias Niessner 和 Lourdes Agapito 是计算机视觉领域的全球顶尖教授。

作为专注于企业级 AI 视频解决方案的平台,Synthesia 的核心使命是帮助客户以最具参与度和有效性的方式,向客户、员工及合作伙伴传递信息。当时,Synthesia 平台的愿景是让任何会使用 PowerPoint 的人都能轻松制作视频,重新定义了 “通过视频交流” 这一信息传递的高效方式。而这一切的起点,源于对一个核心问题的洞察:人们并非想 “玩技术”,而是想解决实际问题 —— 在 Synthesia 的场景中,这个问题就是 “轻松制作视频”。

于是 Victor 和联合创始人们决心围绕 AI 视频技术创办一家商业化公司。

但创业初期的挑战远超想象。

2017 年公司成立时,正值人工智能寒冬,技术不成熟导致大量 AI 公司折戟,Synthesia 的愿景被普遍视为 “疯狂”。团队曾被 100 位投资者拒绝,直到向亿万富翁投资者 Mark Cuban 发送了一封冷邮件 —— 他成为唯一认同其未来愿景的人,不纠结于短期评估,而是相信团队有能力打造真正有价值的东西。“你只需要一个人说‘是’,这就够了。”Roelli 坦言,早期的关键是找到与自己对未来有相似认知的人,而非试图说服怀疑者。

就这样,有了 Mark Cuban 的支持后,Synthesia 才算真正开始走上正轨。

2020 年夏天,Synthesia 发布了首款商业化产品 STUDIO,目前,该产品已被 60 多万家公司使用,其中财富 500 强企业占比超 60%。

据 Victor 介绍, Synthesia 的软件采用了由 Lourdes Agapito 和 Matthias Niessner 开发的深度学习架构,整个平台都建立在深度学习的基础上——借鉴好莱坞视觉特效中的许多已知流程,并训练深度学习网络进行大规模复制。Synthesia 的系统能够在几分钟内合成逼真的人物头像风格视频,使其能够轻松、快速且可扩展地制作用于商业用途的视频。

从技术上讲,Synthesia 的系统使用各种深度学习和计算机视觉技术,包括 GAN(生成对抗网络)。

Synthesia 有何不同?

借助技术平台,Synthesia 将整个视频制作流程简化为一次 API 调用——平均只需 3 分钟即可制作一个视频,而传统制作方式则需要数周时间。企业客户和个人创作者可以无限扩展其制作规模(一个视频大约需要 1 美元),并根据个人用户、公司或员工的需求定制视频内容。

例如在一个例子中 Synthesia 为梅西为百事可乐的乐事系列广告,共制作了 6.5 亿个不同的视频版本。仅在这个项目中,粉丝们就制作了数十万个视频。

Synthesia 平台还提供一系列内置演员,所有客户均可使用,包括每月 30 美元的套餐。这些演员均为真实演员,每次有人与他们合作拍摄视频,他们都会获得报酬。

Synthesia 平台支持 40 种语言。

到了 2024 年 6 月,Synthesia 2.0 正式推出。

Synthesia 2.0 的核心是推出个人 AI 头像。Synthesia 推出了全球首款 Expressive AI 虚拟形象,它由 EXPRESS-1 模型驱动。这些虚拟形象能够理解自己在说什么以及应该如何表达,并根据脚本的上下文调整语调、面部表情和肢体语言。

许多客户都希望拥有自己的虚拟形象,使用 Synthesia 2.0,客户有两种方式创建个人头像:

  • 在工作室使用高清摄像机拍摄的富有表现力的头像,给人一种专业的感觉;

  • 无论家中还是外出,都能在自然背景下使用您的网络摄像头或手机,打造 自定义虚拟形象。这些全新虚拟形象在原来已有的网络摄像头服务基础上进行了改进,提供更佳的唇音同步和更自然的声音,并能够以 30 多种语言复制客户的声音;

据 Victor 透露,用户增长的核心在于区分 “真实用户” 与 “尝鲜者”。平台推出首个头像 MVP(最小可行产品)时曾病毒式传播,大量用户因觉得 “有趣酷炫” 而来制作免费演示视频,但留存率极低。

Victor 指出,关键是识别那些因 “反复出现的实际用例” 而来的用户 —— 他们不将平台视频与专业相机视频比较,而是与文本文档对比,对质量和功能的需求更贴合实际场景。正是这群用户,支撑起了平台可持续的增长,推动收入从 100 万 ARR 到 300 万 ARR,再不断翻倍、三倍增长。如今,Synthesia ARR 已经突破 1 亿美元(约合人民币 7 亿元)。

在产品与增长策略上,Synthesia 走出了一条 “自下而上 + 自上而下” 的融合之路。尽管企业客户是核心价值来源,但团队意识到,让更多人通过免费试用发现自身用例,再由销售团队跟进转化,比单纯依赖企业销售更有效。这种 “产品主导型增长(PLG)” 的模式,需要平衡小公司与大企业的需求,更需要融合 “自助型” 与 “企业销售型” 两种文化 —— 这对资源有限的初创公司而言,是不小的挑战,但 Synthesia 最终找到了平衡之道。

英伟达、字节跳动入股,
估值破百亿

今年 1 月份, Synthesia 获得了由 NEA 领投的 1.8 亿英镑(2.26 亿美元)D 轮融资,使得其估值达 21 亿英镑(25.8 亿美元)。Uber 以及 TikTok 母公司字节跳动等公司均是其投资组合公司。Synthesia 还得到了芯片巨头英伟达的支持。

据技术市场情报公司 Dealroom 称,这项投资使 Synthesia 成为英国估值最高的 Gen AI 媒体公司。

值得一提的是,Synthesia 目前没有积极布局并购领域。迄今为止,Synthesia 尚未进行任何收购。

Victor 表示,其更倾向于自主开发技术,同时使用 API 来处理自身未开发的技术。例如,Synthesia 与 ElevenLabs 合作开发语音技术,并利用和微调各种第三方大型语言模型,而不是自行构建。

Victor 认为,该公司通过专注于商业用户而具有优势,其投资者表示,这正是这家初创公司具有吸引力的原因

“Synthesia 是少数几家能够将真正尖端的人工智能技术转化为实际应用的公司之一,”谷歌风投驻伦敦合伙人 Vidu Shanmugarajah 在接受采访时表示。“它极其注重客户体验,致力于在实际场景中创造价值。将所有这些整合到一个安全合规的平台上,难度极大。”

Atlassian 参与此轮融资也颇具看点。该公司一直在为其各种应用注入 AI 功能,而像 Jira 这样的平台或许会开始在其应用中添加更多视频工具,这似乎只是时间问题,这将为其与投资组合公司的合作打开大门。

“找到不那么起眼的人一起工作”

随着产品被更多人使用,Synthesia 内部团队也在不断扩大。

目前,Synthesia 的年收入有一半以上来自美国客户,而欧洲则占了近一半。

Synthesia 也在加大招聘力度。该公司今年年初聘请了前亚马逊高管彼得·希尔 (Peter Hill) 担任首席技术官。如今,该公司在全球拥有 400 多名员工。

Victor 的团队建设理念同样独特。Victor 认为,初创公司不应执着于从谷歌、Meta 等大厂挖人,那些 “不那么显眼” 却充满 “饥饿感” 的人才往往更有潜力 —— 他们可能没在顶级公司任职,却在管理优秀开源项目中展现出韧性,愿意为初创公司投入全部精力。

Victor 在视频分享中表示:“我认为人们经常犯的一个错误,尤其是那些可能在大型科技公司或类似成功公司工作过的人,他们出去后,尝试从谷歌、Meta、OpenAI 等当时的热门公司挖人,然后说,我有这个很酷的创业想法,你为什么不加入我,我不会付给你那么多,但我会尽量支付差不多的薪水等。当然这是可行的,有很多非常聪明的人也想创业。但很多时候你就是无法直接得到他们,或者如果你得到了他们,他们习惯了非常高的薪水以及在大型科技公司工作的截然不同的生活方式,最终也可能也不会留下来。所以这实际上通常不是最好的路径。”

所以他才去的方式是去招聘一些不那么“起眼”的人。真正要考虑的是一个人的行动力和建设性思维。






“没有什么能让你为真正创业做好准备。就像在麦肯锡工作四年并不会让你成为更好的企业家——它可能只会让你积累更多人脉,或者在融资时稍微轻松一些。但创业真正的内核在于行动力与建设性思维。这也解释了为什么我们在招聘时特别看重那些“不起眼的人才”——那些虽然没有光鲜履历,但持续在开源项目耕耘、始终保持更新迭代的人。如果你内心深处知道自己想建立一家公司,如果你本质上是一个“建筑者”,那么我认为你应该尽快开始,不要害怕行动得太早。厄运场景很少像人们想象的那样可怕。事实上,大多数大公司都会珍惜那些勇于尝试的人,即使他们最终失败了。”


这种敢于尝试的精神,正是推动技术变革的核心动力。就像我们现在正在见证的媒介形态转型——我确实认为世界上的文字会越来越少,但这不意味着文本信息会完全消失。就像我们现在仍然会去剧院,仍然会听黑胶唱片一样,文字肯定会继续存在它的位置。这种演进不是非此即彼的替代,而是使用场景的自然分化。在信息共享、知识培训等领域,我认为我们将进入一个几乎所有内容都以视频和音频形式被消费的世界。未来 10~20 年内,VR 和 AR 技术可能会进一步改变这个局面。

参考链接:

https://www.youtube.com/watch?v=d9SKd-zqYAc

https://techcrunch.com/2025/01/14/synthesia-snaps-up-180m-on-a-2-1b-valuation-for-its-b2b-ai-video-platform/

声明:本文为 AI 前线翻译整理,不代表平台观点,未经许可禁止转载。

会议推荐

首届 AICon 全球人工智能开发与应用大会(深圳站)将于 8 月 22-23 日正式举行!本次大会以 “探索 AI 应用边界” 为主题,聚焦 Agent、多模态、AI 产品设计等热门方向,围绕企业如何通过大模型降低成本、提升经营效率的实际应用案例,邀请来自头部企业、大厂以及明星创业公司的专家,带来一线的大模型实践经验和前沿洞察。一起探索 AI 应用的更多可能,发掘 AI 驱动业务增长的新路径!


今日荐文

图片

你也「在看」吗?👇

关于未来Gen AI视频的延展应用,我觉得除了文章提到的培训、介绍,还有太多想象空间。首先是个性化内容创作:不仅仅是广告,未来教育、娱乐(比如互动电影、游戏NPC的智能表现)、甚至新闻播报都能实现高度个性化,根据用户的实时反馈生成定制化内容。其次是虚拟陪伴与治疗:AI生成的人物可以成为虚拟朋友、心理咨询师,提供情感支持或康复训练。再进一步,结合VR/AR,我们或许能体验到真正意义上的“数字永生”——已逝亲友的数字分身,能以他们的音容笑貌与我们交互,这在伦理上虽有争议,但技术上是可能的。科幻片里的场景,真的一步步走入现实了。

虽然Gen AI视频的发展潜力巨大,但咱们也得理性看待其局限和挑战。比如在新闻传媒领域,尽管能快速生成内容,但真实性和公正性怎么保证?尤其是在深度报道和调查性新闻方面,AI的介入可能带来更多信任危机。在艺术创作方面,虽然AI能辅助创作,但情感的深度、思想的独特表达,目前看来AI仍难以企及。更别提法律和伦理问题,比如深度伪造(Deepfake)的滥用,肖像权、著作权如何界定等等。技术终究是工具,关键在于我们如何负责任地引导和使用它,才能真正造福人类,而不是带来新的社会问题。

Gen AI视频嘛,我觉得离我们最近的,除了商务肯定就是个人生活记录和创作了。现在大家拍个Vlog,剪辑还挺耗时间。未来可能你随手拍几段素材,AI就能自动生成一个有剧情、有配乐、甚至有你自定义‘AI分身’出镜的短视频。再比如在线教育,现在很多网课都是念PPT,以后可能每个学生都能拥有一个专属的AI老师,用你的风格和语速给你讲课。还有客户服务,现在客服AI只是文字或预设语音,未来AI虚拟客服能直接用拟人化的视频跟你沟通,更直观,更亲切,甚至能模拟表情、肢体语言,解决你的问题。想起来都觉得太酷了!

关于Synthesia“不招精英”的策略,我认为这在特定阶段和领域是相当明智的。其核心在于识别“Builder”(建设者)而非“Maintainer”(维护者)。初期创业公司需要的是能从0到1,甚至从-1到1的拓荒者,他们往往具有极高的自主性、解决问题的饥饿感和对不确定性的承受能力。传统大厂的“精英”可能被其生态惯坏,缺乏这种“野性”。挑战在于,随着公司规模扩大,标准化、流程化会要求一定程度的“精英”加入来构建体系,那么这种哲学如何演进,或者如何平衡,会是Synthesia未来面临的课题。但对早期创业来说,这无疑能筛选出最适配的人才。

PLG模式就像是开个‘免费试吃’的餐厅呗!好吃你就多点,甚至打包。对于AI公司来说,这招好啊!你让人先尝尝‘AI视频’这道菜有多‘香’,而不是上来就说这道菜用了多少高科技食材、多少米其林厨师研究出来的。用户觉得‘嗯,这效果确实解决了我的痛点,比如做培训视频再也不用请演员搭景了’,那自然就愿意买单了。但这也有个问题,‘试吃’的门槛不能太高,如果你的AI技术很深,需要很复杂的配置才能跑起来,或者需要很专业的知识才能用好,那PLG就玩不转了,大家‘尝’不成啊!这时候就得销售员上门,像推销高端厨具一样,得手把手教,才能打开市场了。Synthesia这招厉害在把视频制作变得‘像做PPT一样简单’,这就降低了‘试吃’门槛,让PLG跑起来了。

哈哈,‘不招精英’,这不就是说要招‘没那么贵’但‘贼能干’的人嘛!大厂精英通常薪资高,还有各种福利光环,不是一般初创公司能轻松养得起的。Synthesia这招真是高!用性价比高的人才,把钱花在刀刃上。而且,那些在开源社区里摸爬滚打的人,是真的热爱技术、有解决问题的热情,还抗揍(指不怕失败)。唯一的挑战可能就是,当真的需要一些规范化、系统化的能力时,比如公司要上市了,没有一些‘精英’来制定战略和管理,会不会有点吃力?不过,先活下来,再考虑优化嘛!

哎呦,这个话题太有意思了!我身边就有个朋友,之前在大厂累死累活,以为自己是精英,结果跳槽去个初创公司,发现好多事儿根本没人在旁边给你铺好路,从头到尾都得自己撸起袖子干,最后没多久就受不了了。Synthesia这做法,简直是把“识人不清”的坑都规避了。说白了,他们要的是能解决问题的人,不是会提问题的人。缺点嘛……可能团队平均学历不能拿出去炫耀?但谁管那个呢,赚钱和产品好才是硬道理啊!

就Synthesia这种PLG结合企业销售的模式,对于AI基础技术或平台型公司而言,我认为它既是机遇也是挑战。机遇在于,PLG能够实现快速的用户触达和产品验证,特别是在AI技术迭代迅速的当下,用户免费试用是最好的试金石和市场教育方式。它能快速筛选出高价值的“真实用户”,提高销售效率。但挑战在于,AI技术往往复杂且需要定制化,纯粹的PLG可能难以满足大型企业客户的深度需求,这些客户可能需要复杂的集成、数据安全、合规性以及专属的技术支持,这就要求高触达的企业销售介入。此外,如何平衡PLG带来的高流量与企业级产品的稳定性、可靠性,以及免费用户和付费用户的服务差异化,是这类公司需要持续探索的。

PLG对我们这些AI创业公司来说,简直就是‘生命线’啊!你说对不对?特别是产品早期,没啥品牌知名度,靠营销砸钱转化效率又低。用户能自己去玩、去体验,觉得好用再付费,这比我们费劲巴拉去跟客户讲一堆技术原理强太多了!一下子就能过滤掉很多不匹配的用户。但是嘛,有些AI产品部署起来本身就复杂,或者说数据隐私要求很高,用户根本没法‘自助’,那你就得靠销售一个一个去啃。所以Synthesia能把这两种模式结合得这么好,说明他们真的摸透了用户从试用到购买的心理路径,以及企业客户的痛点。这才是真功夫。