吴恩达与OpenAI联手推出免费o1推理课程

吴恩达和OpenAI联合推出了免费课程,教你如何用o1进行推理,提升应用构建能力。

原文标题:联手OpenAI,吴恩达推出一门o1推理新课程,还免费

原文作者:机器之心

冷月清谈:

OpenAI与吴恩达合作推出了一个关于o1模型推理的免费课程,名为“Reasoning with o1”。该课程由OpenAI战略解决方案架构主管Colin Jarvis主讲,旨在教授学生如何利用o1模型进行复杂推理以构建应用程序。

课程内容涵盖o1的即时工程基础、多步骤任务规划与执行、代码创建和编辑、图像推理以及Metaprompting技术等。学生将学习o1的工作原理、适用场景、有效提示方法,以及如何在编码、视觉推理等任务中应用o1。

课程重点介绍了o1模型如何利用强化学习和“思维链”提示来提升推理任务性能,并解释了o1在抽象推理任务(如规划、编码、分析、特定领域推理和STEM科目)中的优势。此外,课程还将探讨o1与其他模型的配合使用,以及如何平衡模型性能和成本之间的关系。

怜星夜思:

1、o1模型相比之前的模型有哪些改进,除了文章提到的“思维链”推理,还有什么其他重要的特性?
2、课程中提到了o1模型在编码任务上表现出色,它能取代程序员吗?
3、Metaprompting技术是如何提升o1模型性能的?它与传统的prompting方法有什么区别?

原文内容

机器之心报道

编辑:小舟


在刚刚过去的 2024 年,OpenAI 推出了 o 系列模型。相比于以往大型语言模型,o 系列模型使用更多的计算进行更深入的「思考」,能够回答更复杂、更细致的问题。


通过在推理时执行思维链推理,o 系列模型在新兴用例中表现出色,包括多步骤规划、图像推理和长期编码。那么,具体如何使用 o 系列模型来构建需要复杂推理的应用程序呢?


最近,OpenAI 联合人工智能著名学者、斯坦福大学教授吴恩达推出了一门关于使用 o1 进行推理的免费 DeepLearning.AI 课程 ——Reasoning with o1,讲师是 OpenAI 战略解决方案架构主管 Colin Jarvis。



课程地址:https://www.deeplearning.ai/short-courses/reasoning-with-o1


Reasoning with o1课程内容主要包括:


  • o1 即时工程的基础知识
  • 规划和执行多步骤任务
  • 创建和编辑代码
  • 图像推理
  • 可提高模型性能的 Metaprompting


通过这门课程,学生将:


  • 了解 o1、它的工作原理、性能以及使用它的最佳场景。
  • 了解如何有效地提示 o1 以及何时将任务委派给更具成本效益、更低延迟的模型。
  • 了解 o1 如何在编码和视觉推理任务上表现出色,以及如何应用 Metaprompting 来优化应用程序。



具体来说,在 Reasoning with o1课程中,学生将了解 OpenAI 如何利用强化学习来构建使用「测试时计算」来提高推理任务性能的模型;了解什么是「思维链」提示,以及 o1 如何自主地利用它来将问题分解为更小的步骤,尝试多种策略,并在回答问题之前仔细思考。


o1 模型特别擅长抽象推理任务。它在规划、编码、分析、特定领域推理(如法律)和 STEM 科目等任务上具有破纪录的性能。Reasoning with o1课程内容涵盖:


  • 学习识别 o1 模型适合哪些任务,以及何时需要使用更小或更快的模型,或将这两者结合起来。
  • 了解使用 o1 进行提示的四个关键原则,并探索性能上的差异。
  • 实现一个多步骤任务,其中 o1 作为协调器创建规划并将其交给 4o-mini 模型按顺序执行规划,平衡智能和成本之间的权衡。
  • 使用 o1 执行编码任务,构建新应用程序、编辑现有代码,并通过在 o1-mini 和 GPT 4o 之间运行编码竞赛来测试性能。
  • 使用 o1 进行图像理解,并了解它如何通过层次推理获得更好的性能,其中它会预先产生延迟和成本,预处理图像并使用丰富的细节对其进行索引,以便稍后用于问答。
  • 学习一种称为 Metaprompting 的技术,以使用 o1 来改进提示。


怎么说?来学习吗?


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]


取代程序员?想多了吧!o1充其量就是个高级代码生成器,离真正的“程序员”还差得远呢!程序员需要的是对整个软件开发流程的理解和掌控,o1目前还做不到这一点。

我觉得除了“思维链”推理外,o1的“测试时计算”也很重要,它能让模型在推理时动态地分配计算资源,从而更好地处理复杂问题。就像我们做题一样,遇到难题会多花点时间思考,简单题就快速过,o1也能做到这一点。

从OpenAI的介绍来看,o1的泛化能力也应该有所提升,这意味着它能更好地适应新的、未见过的任务,减少对特定领域数据的依赖。这对于实际应用来说非常重要,毕竟我们不可能为每个任务都收集大量数据。

我觉得o1还不能完全取代程序员。它可以辅助我们编写代码、提高效率,但程序员的工作不仅仅是写代码,还包括需求分析、系统设计、测试等等,这些都需要人类的创造力和判断力。

关于“Metaprompting与传统的prompting方法有什么区别”,我认为Metaprompting更注重prompt的结构和策略,而不仅仅是关键词的堆砌。它会考虑如何引导o1进行更深入的思考,而不是简单地给出答案。

Metaprompting简单来说就是用o1生成更优的prompt,有点像“套娃”。传统的prompting是人工设计的,而Metaprompting利用了o1自身的推理能力,可以生成更复杂、更有效的prompt,从而提高模型的性能。

Metaprompting可以看作是prompt engineering的自动化版本,它能根据具体任务自动调整prompt,避免了人工反复尝试的繁琐过程。这就像我们以前拍照需要手动调焦,现在相机可以自动对焦一样,更加方便快捷。

o1更像是程序员的“超级助手”,可以帮我们处理一些重复性的、繁琐的编码工作,让我们有更多时间专注于更具挑战性的任务。就像以前的计算器一样,它不会取代数学家,只会让数学家更高效。

o1的改进应该也体现在对上下文的理解能力上,毕竟用了更多的计算资源进行训练。我猜测它在处理长文本、多轮对话等场景下会有更出色的表现,不像以前的模型那么容易“失忆”。