GPT-4o主创离职创业,Her愿景创造者另寻出路

原文标题:刚刚,GPT-4o关键人物离职创业!曾在OpenAI最早提出构建「Her」

原文作者:机器之心

冷月清谈:

**GPT-4o关键人物离职创业**
  • OpenAI的GPT-4o项目关键人物Alexis Conneau近日宣布离职创业。
  • Conneau是OpenAI最早提出构建类科幻电影《Her》中AI助理设想的“Her”愿景的人。
  • 他领导了GPT-4o项目的研究,该模型在文本、视觉和音频方面展现出类似人类的对话能力,并允许用户随时打断,感知和回应用户的情绪。

Conneau的创业方向

  • Conneau尚未透露具体创业方向,但表示更想追求“通用情感智能(AGEI)”。

Conneau的背景和成就

  • Conneau拥有数学和计算机科学背景,曾先后在Facebook、谷歌和OpenAI工作。
  • 他在文本和语音神经网络领域做出了重要贡献,包括创建首个原生集成音频的GPT模型、第一个无监督文本翻译和语音转录神经网络等。
  • 他的工作极大地增强了服务于数亿人的文本和语音系统。

其他信息

  • GPT-4o目前仍未向全部用户开放,只有部分ChatGPT Plus用户可以使用。
  • Conneau的离职引发外界对OpenAI近期人员流失的猜测。



怜星夜思:


1、Conneau离职的原因猜测?
2、Her愿景的实现还有多远?
3、通用情感智能(AGEI)的前景如何?

原文内容

机器之心报道

机器之心编辑部


OpenAI 最早提出构建「Her」的那个人,刚刚宣布离职创业了。


今年 5 月份,OpenAI 发布了震惊世界的 GPT-4o。这个模型可以跨越文本、视觉和音频,以一种非常自然的形式和人类语音对话,延迟低到与人类在对话中的响应时间相似。而且,它允许用户随时打断,并能感知和回应用户的情绪。因此,该模型发布后,很多人说科幻电影《Her》中的场景照进了现实。


此次离职的 Alexis Conneau 就是 GPT-4o 项目的关键人物之一。离职前,他是 OpenAI 音频 AGI 研究负责人,也是 OpenAI 最早提出 Her 愿景的人。他在领英的个人简介中写道,他是「专注于多模态和音频 AGI 的人工智能研究员,在 OpenAI 领导了『Her』的研究(GPT4-o 和 GPT-5),这是首个原生集成音频的 GPT 模型。」



关于离职后的创业方向,Conneau 还没有透露详细信息。但在被问及「AGI 时间表」时,他回答说自己更想追求「通用情感智能(General Emotional Intelligence,AGEI)」。



Conneau 的离职帖子引起了很多人关注,相信很多 VC 已经开始行动了。



有意思的是,直到 Conneau 离职,他参与构建的 GPT-4o 还没有向全部用户开放,目前只有部分 ChatGPT Plus 用户可以使用(此前有消息称今年秋季向所有 Plus 付费用户开放)。



同时,他的离职也加重了外界的疑问:最近那么多人离职,OpenAI 到底发生了什么? 




Alexis Conneau 个人经历


Alexis Conneau 本科毕业于巴黎综合理工学院(法国的工程师大学,在法国各类院校中常年排名第一),也在该校拿到了硕士学位。之后,他又获得了巴黎 - 萨克雷高等师范学校的机器学习硕士学位。这一阶段,他打好了数学和计算机科学的教育基础。



之前有报道称,他在巴黎综合理工学院学习的是纯数学,并且他喜欢思考数字。而当时,科技行业已经将数字游戏变成了一种价值数十亿美元的艺术形式。所以当他毕业时,他选择了科技。


2015 年,Conneau 加入了 Facebook 在巴黎的新人工智能实验室。该实验室是在美国顶尖科技巨头的全球扩张行动中成立的:每个人都想在全球最有才华的研究和工程专业学生毕业前将他们招揽过来。2019 年,Conneau 拿到了他的博士学位。



之后,Conneau 先后在 Facebook AI Research 、谷歌和 OpenAI 工作,并在文本和语音神经网络领域做出过重要贡献。



他的主要成就如下:


  • 在 OpenAI 通过 GPT-4o 创建了第一个版本的「Her」。Conneau 表示,是他将这一愿景带到了 OpenAI,并与一位同事合作,(几乎)从零开始构建了这个音频 LLM 研究。

  • 创建了首个能够在没有任何监督的情况下翻译文本和转录语音的神经网络(无监督 MT 和 ASR)。

  • 为文本和语音构建了通用的多语言掩蔽语言模型表示(XLM-R、Wav2vec 2.0 XLS-R)。

  • 在 Meta 和谷歌推广这些语言模型表示,通过文本分类、机器翻译和语音识别等各种应用影响了 10 亿用户。

  • 发现了「零样本跨语言迁移('zero-shot cross-lingual transfer)」的概念,证明多语言语言模型在单一语言上经过微调后,可以在其他语言上有效运行(XNLI、XLM)。

  • 开源 Facebook AI Research 最受欢迎的基础文本和语音掩蔽语言模型(XLM-R 和 Wav2vec 2.0 XLS-R),可在 Hugging Face 上获取。


此外,他还曾在 EMNLP(2017 年、2018 年)和 SLT(2022 年)上获得最佳论文奖,并在 JMLR、NeurIPS 和 ICML 等顶级期刊和会议上发表过论文。他的工作极大地增强了服务于数亿人的文本和语音系统。


三年前,《华盛顿邮报》为他写过一篇专题文章。


报道链接:https://www.washingtonpost.com/technology/2021/07/01/humans-ai-language-advances-risks/


关于 Conneau 新公司的信息,我们将跟进报道,敬请期待。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

Her愿景的实现是一个复杂且长远的目标,涉及到自然语言处理、机器学习和人工智能等多个领域的前沿进展。目前的技术水平距离实现一个完全符合Her愿景的AI还有相当大的差距。不过,像GPT-4o这样的突破性进展不断涌现,为Her愿景的实现提供了可能。预计在未来几年内,我们将看到AI在情感智能和对话能力方面的显著进步,为Her愿景的实现奠定基础。

从报道中看,Conneau更想追求“通用情感智能(AGEI)”,这可能也是他选择离职创业的原因。他或许认为在OpenAI无法获得足够的资源和支持来探索这个方向,因此选择另起炉灶。

从技术角度看,Her愿景的实现需要解决许多挑战,比如如何让AI理解和表达情感、如何让AI对上下文和语境有深入的理解,以及如何让AI具备同理心和共情能力。这些都是人工智能领域的难题,需要持续的研究和突破。

Conneau离职的原因可能是多种多样的。一种可能是他认为在OpenAI无法充分发挥自己的才能和抱负,希望通过创业来寻求更大的发展空间。另一种可能是他对于OpenAI的未来发展方向有不同意见,选择另谋出路。此外,个人因素,如家庭、健康等,也可能成为他离职的原因之一。

AGEI,一听就是个高大上的概念,但我很好奇它和我们平时说的情商有什么区别?

哈哈,别想太多了,说不定就是人家老婆催着要买大房子了。创业嘛,你懂的,搞不好融资几轮直接财务自由了。

AGEI的前景如何,还得看具体落地应用。如果AGEI能够真正提升AI的情感理解和交互能力,那么它将在各个领域都有广阔的应用前景。不过,如果AGEI只是停留在概念层面,或者无法达到预期的效果,那么它的前景就会大打折扣。

通用情感智能(AGEI)的前景被广泛看好,被视为人工智能发展的一个重要方向。AGEI旨在赋予AI理解、表达和响应人类情感的能力。这将对许多领域产生重大影响,比如人机交互、医疗保健、教育和娱乐。随着AI技术的发展和数据积累的不断增多,AGEI有望在未来几年内取得突破性进展。

我觉得Her愿景的实现还需要很长时间,毕竟情感智能是人类独有的复杂能力。不过,AI在情感识别和生成方面取得的进展令人印象深刻,相信未来有一天,AI将能够像人类一样理解和表达情感,实现Her愿景。