Flapping Airplanes获1.8亿美元融资:押注小数据,探索AI新范式

Flapping Airplanes 获融资,另辟蹊径探索小数据造强智能,或将颠覆AI发展。

原文标题:Karpathy盛赞,啥都没有的创业公司刚融了1.8亿美元,要用小数据造强智能

原文作者:机器之心

冷月清谈:

Flapping Airplanes 是一家专注于解决 AI 数据效率问题的初创公司,获得了 1.8 亿美元的融资和 Andrej Karpathy 的力挺。该公司致力于通过重新思考损失函数和梯度下降等方式,探索在少量数据下实现人类水平思考的方法,旨在突破现有大模型依赖海量数据的局限。他们认为,当前 AI 模型与人类大脑之间存在巨大的样本效率差距,需要通过颠覆式创新来实现数量级的跃迁。虽然公司目前不急于商业化,但其研究成果有望在企业级应用、机器人等领域释放巨大价值。Karpathy 认为,Flapping Airplanes 具备全栈理解能力和出色的人才判断力,有望在 AI 领域取得突破性进展。

怜星夜思:

1、Flapping Airplanes 试图通过减少数据依赖来提升 AI 的思考能力,你认为这种思路可行吗?如果可行,最大的挑战会是什么?
2、Flapping Airplanes 的名字“扑翼飞机”很有意思,你觉得这个名字体现了他们什么样的理念?你觉得还有哪些名字更适合这家公司?
3、文章中提到 Karpathy 盛赞 Flapping Airplanes 具备从上到下的全栈理解能力,你认为这种能力对于 AI 研究来说有多重要?为什么?

原文内容

图片
编辑|冷猫

你想象中真正的 AI 是什么样子的?


至少有一点,大多数人会同意:未来的 AI,应该具备像人一样思考的能力。


问题在于,我们现在研究大模型走的这条路,能通向真正的「思考」吗?


当前最先进的大模型系统,几乎是在整个人类可获取的历史数据之上训练出来的:网页、书籍、代码、论文、对话,数万亿 token。训练大模型所需的数据,远超任何一个人类个体一生所能接触的总和。


AI 需要整个互联网来学习,而人类只需要一个童年。人类在成年之前,所接触的语言、文本与符号,顶多只有几十亿 token,相差几个数量级。


正是从这个问题出发,一家几乎没有产品、没有盈利、也不急于商业化的 AI 创业公司,从 GV、Sequoia 和 Index 拿到了 1.8 亿美元融资,并获得了 Andrej Karpathy 的公开力挺。


它的名字,叫 Flapping Airplanes。



Flapping Airplanes 是一家基础 AI 研究实验室,专注于解决「数据效率」这一核心问题,并正在探索一些看似怪异、但可能至关重要的新思路 —— 从重新思考损失函数,到甚至质疑和重构梯度下降本身。该公司的研究团队成员中包括 IMO、IOI、IPhO 奖牌得主等顶尖人才。


Flapping Airplanes 称,其融资用来组建 AI 的新防线:一个想象中的世界,模型可以在不用摄入互联网一半内容的情况下达到人类水平的思考。


他们的估计是:在人类与现有模型之间,样本效率存在着 10 万倍到 100 万倍的差距。


要实现如此数量级的跃迁,仅靠渐进式改进是不够的 —— 需要真正的 Big ideas。


他们在推文中表示,公司的唯一目标,是做真正优秀、能够改变范式的研究。尽管目前并不急于商业化,但这些工作最终将在企业级应用、机器人、交易系统、科学发现等领域释放出巨大的价值。


「Flapping Airplanes」这个名字,正是公司文化的写照:我们是谁、我们在做什么,本身就是 out-of-distribution 的。非常非典型的活跃性公司文化,从他们的推文中能看出一丝严谨学术之外的跳脱。



我们甚至发现,Flapping Airplanes 官方推特的关注列表里,真的有旧金山机场和两大美国航司……(这是真的要起飞了)



一家没有产品、没有盈利、也不急于商业化的 AI 创业公司获得融资的事情似乎有些似曾相识。


主流观点是:AI 已经发展到如此阶段,一家新的、以研究为导向的创业公司,几乎不可能在竞争和执行层面上战胜现有巨头。「就你们这么几个人,怎么可能和 Google 竞争?」


但 Andrej Karpathy 毫不留情地指出:这种说法,在 OpenAI 成立时就是错的;后来,又一次被证明是错的。



当然,持续扩大规模、在有效路径上进行局部优化,仍然会带来惊人的进步。但与此同时,我们正以极快的速度解锁大量进展,整个领域被扬起了巨大的「技术尘埃」。


而且,前沿大模型与「一个只消耗 20 瓦功率的人类大脑」这一智慧奇迹之间,依然存在着巨大的鸿沟。正因如此,我认为,能够带来接近 10 倍提升(而非 10% 微增)的研究级突破,其概率依然非常高 —— 高到值得持续下注、持续寻找。


真正棘手的问题,当然在于:如何创造出能够孕育这种突破的环境。


Karpathy 认为,这样的环境极为罕见。但他盛赞 Flapping Airplanes,他们具备(罕见的)从上到下的全栈理解能力,并且对人才有极好的判断力。


希望扑翼飞机能够打开人工智能的航空新时代。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com


理论上是可行的。人类的学习过程是高度抽象和归纳的过程,能够从少量数据中提取出关键信息。但是,要让 AI 做到这一点,需要突破现有的算法框架,找到更有效的学习方法。个人认为,难点在于如何让 AI 具备类似人类的认知能力,例如常识推理、因果关系判断等等。

全栈理解能力对于AI研究来说是超级加分项。现在很多AI研究都过于关注某个特定的算法或者模型,而忽略了整个系统的协同效应。具备全栈理解能力的研究者,能够更好地发现问题、解决问题,并且能够更好地将研究成果落地,避免出现象牙塔里的研究。但是,这种能力很难培养,需要长时间的积累和实践。

感觉这个名字很geek,扑翼飞机本身就是一种非常规的飞行方式,也暗示了他们要走一条与众不同的道路。也可能暗示了他们面临的挑战,扑翼飞机研发难度很高,可能失败。我觉得“小步快跑”或者“数据炼金术”更适合他们,更务实一些。

我觉得Karpathy说的全栈能力,不只是技术上的,更重要的是思维上的,对整个AI领域发展趋势的理解。能更好的判断研究方向,避免重复造轮子,最终达到事半功倍的效果。

有没有一种可能,他们就是随便起了个名字?(手动狗头)不过认真来说,扑翼飞机可能象征着一种更轻量级、更灵活的 AI 实现方式,不需要那么多“燃料”(数据)也能飞起来。我觉得“灵犀”这个名字不错,寓意着 AI 能够像人类一样,一点就通。

个人感觉有点悬。现在的大模型虽然需要大量数据,但至少证明了这条路是可行的。Flapping Airplanes 的思路有点像是在走钢丝,风险很高,但是如果成功了,收益也很大。最大的挑战在于,如何证明这种方法比现有的大模型更有优势,毕竟时间和资源都是有限的。

“扑翼飞机”这个名字,致敬莱特兄弟吧,感觉寓意着他们想要像莱特兄弟一样,用一种全新的方式(扑翼代替固定翼)来改变 AI 领域(航空领域)的格局。我觉得“思维跃迁”或者“智核”这样的名字也挺适合的,更直接地体现了他们的目标。

Karpathy 的认可很重要!我觉得全栈理解能力,意味着他们对 AI 的各个层面都有深入的了解,从硬件到软件,从算法到应用。这对于解决实际问题来说至关重要,可以避免只见树木不见森林的情况。这就像盖房子,你既要懂设计,也要懂施工,才能把房子盖好。