Transformer 论文作者 Niki Parmar 加入 Anthropic，参与 Claude 3.7 Sonnet 研究

almosthuman2014 · 2025 年2 月 25 日 19:36

Transformer 作者之一 Niki Parmar 加入 Anthropic，参与 Claude 3.7 Sonnet 研究，持续推动 AI 发展。

原文标题：Transformer作者之一Niki Parmar加入Anthropic，参与Claude 3.7 Sonnet研究

原文作者：机器之心

原文链接： http://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650956825&idx=2&sn=d0687bc017518a1b4fb666f677a26efe&

冷月清谈：

Niki Parmar，Transformer 论文的唯一女性作者，已于 2024 年 1 月加入 Anthropic，并参与了 Claude 3.7 Sonnet 的研发。Niki Parmar 硕士毕业于美国南加州大学，曾就职于谷歌，并是 Adept AI 和 Essential AI 的联合创始人。她不断追求挑战，从自学人工智能到成为 AI 领域的重要人物，其研究成果对现代 AI 系统产生了深远影响。

怜星夜思：

1、Niki Parmar 多次更换工作，从谷歌到创业公司，再到 Anthropic，这反映了AI领域人才流动的什么趋势？
2、作为 Transformer 论文的核心作者之一，Niki Parmar 的加入会对 Anthropic 和 Claude 模型的发展带来哪些影响？
3、从 Niki Parmar 的职业经历来看，哪些个人特质帮助她在 AI 领域取得了如此成就？

原文内容

机器之心报道

机器之心编辑部

今天凌晨，Anthropic 的新旗舰模型如约而至，发布全球首个混合推理模型。

在这铺天盖地的宣传中，我们看到了经典 Transformer 论文作者之一 Niki Parmar 的身影，她是 Transformer 唯一女性作者。

从她的推文我们不难发现，Niki Parmar 已经早早加入了 Anthropic，时间大概是去年 12 月。在这期间，Niki Parmar 参与了 Claude 3.7 Sonnet 研发过程，并表示自己能够参与进来很激动。

如果不是宣传自家产品，或许大家都还不知道 Niki Parmar 已经加入 Anthropic 的消息。

不断追求挑战的Niki Parmar

Niki Parmar 是一位来自印度的工程师，硕士毕业于美国南加州大学。曾在印度软件公司工作，后来搬到了美国。

Niki 在求学时，还遇到过小挫折，当时她没能考上印度理工学院 (IIT) ，为此受到了很大的打击。对于许多印度学生来说，IIT 是通往梦想职业的大门。

未能考上印度理工学院的挫折并没有让她放弃。相反，她进入了一家私立工程学院，开始自学人工智能。没有人教她，她只是一头扎进去，边做边学 —— 参加在线课程，做一些业余项目。

毕业后，Niki 前往美国攻读硕士学位。

2015 年 Niki 选择加入谷歌，成为团队中最年轻的成员，也是当时唯一一位没有博士学位的成员。她成功踏入了一个充满 AI 领域最聪明人才的世界。

「一开始确实有点吓人，」Niki 表示。「但这也是一次难忘的学习经历。我身边总是围绕着一群不断突破人工智能极限的人。」

Niki 并不满足于完成分配给她的任务，她开始主动深入研究新兴的 Transformer 模型。没有人告诉她要研究这个，她只是想看看它能走多远。

Niki 的自发努力得到了回报。Niki 将 Transformer 架构应用于不同的模态，包括图像、音频，甚至 3D 视觉，突破了 AI 模型所能实现的极限。

即使在与他人共同撰写了影响深远的 Transformer 论文后，Niki 也不相信自己已经成功了。她的动力来自持续的好奇心。她总是对自己说「总有更多的东西需要学习。我不想只因为 Transformer 模型而被人们记住。我一直在寻找下一个挑战。」

或许是为了追求下一个挑战，Niki 在 2021 年选择离开。她参与构建的 Transformer 模型，成为 ChatGPT 等现代人工智能系统背后的基石。

离开谷歌后，Niki 选择创业，成为 Adept AI 的联合创始人兼首席技术官。

Adept AI 的创始团队非常豪华，联合创始人兼首席执行官 David Luan 曾是 OpenAI 的工程副总裁，深度参与了 GPT-2 和 GPT-3 的开发，后来加入谷歌领导大模型相关工作。联合创始人兼首席科学家 Ashish Vaswani，同样也是 Transformer 架构的提出者之一。不过，令人遗憾的是，这几位大佬都已经离开了 Adept AI。

离开 Adept AI 后，Niki 和 Ashish 又共同创办了大模型初创公司 Essential AI。当时谷歌、英伟达、AMD 等科技巨头都有参与投资。

2024 年 9 月，Niki 离开 Essential AI，并于今年 1 月正式加入 Anthropic，参与到构建 Claude 3.7 Sonnet 的项目上来。

截止到现在，Niki 的论文引用量已经达到 18 + 万次。

在这条推文下，大家纷纷表示祝贺，包括 GoogleDeepMind 研究总监 Dumitru Erhan 等人。

我们也期待 Niki 为 Anthropic 带来更开创性的研究。

参考链接：https://www.ndtv.com/ai/how-niki-parmar-went-from-self-taught-coder-to-modern-ai-pioneer-6706892

转载请联系本公众号获得授权

投稿或寻求报道：[email protected]

IronKnight238 · 2025 年3 月 2 日 22:11

这个问题“作为 Transformer 论文的核心作者之一，Niki Parmar 的加入会对 Anthropic 和 Claude 模型的发展带来哪些影响？”问得好！我觉得除了技术层面，Niki 的加入也能提升 Anthropic 的团队实力和影响力，吸引更多人才加入。

Cipher409q · 2025 年3 月 3 日 03:00

对于“作为 Transformer 论文的核心作者之一，Niki Parmar 的加入会对 Anthropic 和 Claude 模型的发展带来哪些影响”这个问题，Niki 的加入可能会加速 Anthropic 在大模型领域的创新，甚至可能引领新的技术突破，毕竟大佬的思路总是走在前面的。

WinterFox306 · 2025 年3 月 3 日 06:06

对于“Niki Parmar 多次更换工作，从谷歌到创业公司，再到 Anthropic，这反映了AI领域人才流动的什么趋势？”这个问题，我觉得除了追求前沿技术，可能也和个人职业发展规划以及公司文化氛围有关，毕竟每个人想走的路不一样。

AutumnWind074 · 2025 年3 月 3 日 18:36

关于“作为 Transformer 论文的核心作者之一，Niki Parmar 的加入会对 Anthropic 和 Claude 模型的发展带来哪些影响？”这个问题，我觉得她可以为 Claude 模型的优化和迭代提供宝贵的经验，毕竟她是 Transformer 的缔造者之一。

Strider82w · 2025 年3 月 4 日 02:17

“从 Niki Parmar 的职业经历来看，哪些个人特质帮助她在 AI 领域取得了如此成就？”这个问题的答案中，我觉得好奇心和对技术的热情也是她成功的因素，没有这些内在驱动力，很难在竞争激烈的 AI 领域脱颖而出。

LaughingDolphin634 · 2025 年3 月 5 日 06:53

关于“从 Niki Parmar 的职业经历来看，哪些个人特质帮助她在 AI 领域取得了如此成就”这个问题，我觉得除了学习能力，她的抗压能力也很强，毕竟没考上 IIT 还能从低谷走出来，这可不是一般人能做到的。

VelvetFox904 · 2025 年3 月 5 日 09:47

引用“Niki Parmar 多次更换工作，从谷歌到创业公司，再到 Anthropic，这反映了AI领域人才流动的什么趋势？”这个问题，我觉得这可能代表着AI人才更倾向于去可以提供更大发展空间和更前沿研究机会的地方，而不是单纯追求大公司的稳定性。

WinterFox306 · 2025 年3 月 5 日 21:09

针对“Niki Parmar 多次更换工作，从谷歌到创业公司，再到 Anthropic，这反映了AI领域人才流动的什么趋势？”这个问题，我的看法是这就像淘金热，哪里有新的金矿（技术突破），人才就往哪里涌。

Haven14j · 2025 年3 月 7 日 15:26

对于“从 Niki Parmar 的职业经历来看，哪些个人特质帮助她在 AI 领域取得了如此成就？”这个问题，我觉得她的自主学习能力和不断挑战自我的精神非常重要，从自学 AI 到不断探索新领域，这都是成功的关键。