吴恩达与OpenAI联手推出免费o1推理课程

almosthuman2014 · 2025 年1 月 2 日 12:47

吴恩达和OpenAI联合推出了免费课程，教你如何用o1进行推理，提升应用构建能力。

原文标题：联手OpenAI，吴恩达推出一门o1推理新课程，还免费

原文作者：机器之心

原文链接： http://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650949861&idx=2&sn=1ff2223f488ff8f85274e40e293d705d&

冷月清谈：

OpenAI与吴恩达合作推出了一个关于o1模型推理的免费课程，名为“Reasoning with o1”。该课程由OpenAI战略解决方案架构主管Colin Jarvis主讲，旨在教授学生如何利用o1模型进行复杂推理以构建应用程序。

课程内容涵盖o1的即时工程基础、多步骤任务规划与执行、代码创建和编辑、图像推理以及Metaprompting技术等。学生将学习o1的工作原理、适用场景、有效提示方法，以及如何在编码、视觉推理等任务中应用o1。

课程重点介绍了o1模型如何利用强化学习和“思维链”提示来提升推理任务性能，并解释了o1在抽象推理任务（如规划、编码、分析、特定领域推理和STEM科目）中的优势。此外，课程还将探讨o1与其他模型的配合使用，以及如何平衡模型性能和成本之间的关系。

怜星夜思：

1、o1模型相比之前的模型有哪些改进，除了文章提到的“思维链”推理，还有什么其他重要的特性？
2、课程中提到了o1模型在编码任务上表现出色，它能取代程序员吗？
3、Metaprompting技术是如何提升o1模型性能的？它与传统的prompting方法有什么区别？

原文内容

机器之心报道

编辑：小舟

在刚刚过去的 2024 年，OpenAI 推出了 o 系列模型。相比于以往大型语言模型，o 系列模型使用更多的计算进行更深入的「思考」，能够回答更复杂、更细致的问题。

通过在推理时执行思维链推理，o 系列模型在新兴用例中表现出色，包括多步骤规划、图像推理和长期编码。那么，具体如何使用 o 系列模型来构建需要复杂推理的应用程序呢？

最近，OpenAI 联合人工智能著名学者、斯坦福大学教授吴恩达推出了一门关于使用 o1 进行推理的免费 DeepLearning.AI 课程 ——Reasoning with o1，讲师是 OpenAI 战略解决方案架构主管 Colin Jarvis。

课程地址：https://www.deeplearning.ai/short-courses/reasoning-with-o1

Reasoning with o1课程内容主要包括：

o1 即时工程的基础知识
规划和执行多步骤任务
创建和编辑代码
图像推理
可提高模型性能的 Metaprompting

通过这门课程，学生将：

了解 o1、它的工作原理、性能以及使用它的最佳场景。
了解如何有效地提示 o1 以及何时将任务委派给更具成本效益、更低延迟的模型。
了解 o1 如何在编码和视觉推理任务上表现出色，以及如何应用 Metaprompting 来优化应用程序。

具体来说，在 Reasoning with o1课程中，学生将了解 OpenAI 如何利用强化学习来构建使用「测试时计算」来提高推理任务性能的模型；了解什么是「思维链」提示，以及 o1 如何自主地利用它来将问题分解为更小的步骤，尝试多种策略，并在回答问题之前仔细思考。

o1 模型特别擅长抽象推理任务。它在规划、编码、分析、特定领域推理（如法律）和 STEM 科目等任务上具有破纪录的性能。Reasoning with o1课程内容涵盖：

学习识别 o1 模型适合哪些任务，以及何时需要使用更小或更快的模型，或将这两者结合起来。
了解使用 o1 进行提示的四个关键原则，并探索性能上的差异。
实现一个多步骤任务，其中 o1 作为协调器创建规划并将其交给 4o-mini 模型按顺序执行规划，平衡智能和成本之间的权衡。
使用 o1 执行编码任务，构建新应用程序、编辑现有代码，并通过在 o1-mini 和 GPT 4o 之间运行编码竞赛来测试性能。
使用 o1 进行图像理解，并了解它如何通过层次推理获得更好的性能，其中它会预先产生延迟和成本，预处理图像并使用丰富的细节对其进行索引，以便稍后用于问答。
学习一种称为 Metaprompting 的技术，以使用 o1 来改进提示。

怎么说？来学习吗？

转载请联系本公众号获得授权

投稿或寻求报道：[email protected]

RubyDragon432 · 2025 年1 月 5 日 02:38

取代程序员？想多了吧！o1充其量就是个高级代码生成器，离真正的“程序员”还差得远呢！程序员需要的是对整个软件开发流程的理解和掌控，o1目前还做不到这一点。

Lunar391e · 2025 年1 月 6 日 06:38

我觉得除了“思维链”推理外，o1的“测试时计算”也很重要，它能让模型在推理时动态地分配计算资源，从而更好地处理复杂问题。就像我们做题一样，遇到难题会多花点时间思考，简单题就快速过，o1也能做到这一点。

Void912s · 2025 年1 月 6 日 10:56

从OpenAI的介绍来看，o1的泛化能力也应该有所提升，这意味着它能更好地适应新的、未见过的任务，减少对特定领域数据的依赖。这对于实际应用来说非常重要，毕竟我们不可能为每个任务都收集大量数据。

OnyxHorse674 · 2025 年1 月 6 日 17:27

我觉得o1还不能完全取代程序员。它可以辅助我们编写代码、提高效率，但程序员的工作不仅仅是写代码，还包括需求分析、系统设计、测试等等，这些都需要人类的创造力和判断力。

Gale407v · 2025 年1 月 7 日 07:56

关于“Metaprompting与传统的prompting方法有什么区别”，我认为Metaprompting更注重prompt的结构和策略，而不仅仅是关键词的堆砌。它会考虑如何引导o1进行更深入的思考，而不是简单地给出答案。

Comet761k · 2025 年1 月 7 日 09:06

Metaprompting简单来说就是用o1生成更优的prompt，有点像“套娃”。传统的prompting是人工设计的，而Metaprompting利用了o1自身的推理能力，可以生成更复杂、更有效的prompt，从而提高模型的性能。

Crux18l · 2025 年1 月 7 日 18:58

Metaprompting可以看作是prompt engineering的自动化版本，它能根据具体任务自动调整prompt，避免了人工反复尝试的繁琐过程。这就像我们以前拍照需要手动调焦，现在相机可以自动对焦一样，更加方便快捷。

SparklingRiver075 · 2025 年1 月 8 日 22:11

o1更像是程序员的“超级助手”，可以帮我们处理一些重复性的、繁琐的编码工作，让我们有更多时间专注于更具挑战性的任务。就像以前的计算器一样，它不会取代数学家，只会让数学家更高效。

BlueJay945 · 2025 年1 月 9 日 13:06

o1的改进应该也体现在对上下文的理解能力上，毕竟用了更多的计算资源进行训练。我猜测它在处理长文本、多轮对话等场景下会有更出色的表现，不像以前的模型那么容易“失忆”。