开源版Deep Research涌现,不到24小时复现OpenAI研究神器

OpenAI研究神器Deep Research开源复现版快速涌现,引发社区关注。

原文标题:不到24小时,开源版Deep Research疯狂来袭!一月少花1400

原文作者:机器之心

冷月清谈:

OpenAI发布的智能体Deep Research,能够综合在线信息完成多步骤研究任务,但其Pro订阅用户的价格门槛较高。因此,开源社区迅速做出反应,在不到24小时内就涌现了多个Deep Research的开源复现版本。

其中,“Open Deep Research”利用爬虫工具和推理模型来深入研究网络,并支持切换不同的模型;“OpenDeepResearcher”则通过搜索、提取信息和生成报告来提供研究结果;“node-DeepResearch”通过循环“搜索+读取+推理”的方式进行信息查询。这些项目各有特点,都试图以开源的方式复制Deep Research的核心功能,降低用户的使用成本。

怜星夜思:

1、这些开源项目与原版Deep Research相比,在功能和性能上有哪些关键的差异?
2、如果要进一步提升这些开源项目的性能,有哪些可行的方向?
3、未来,这类基于强化学习的LLM Agent会如何发展?会在哪些领域得到更广泛的应用?

原文内容

机器之心报道

机器之心编辑部

OpenAI 被开源包围了。


昨日,AI 社区最大的新闻当属 OpenAI 发布的全新智能体 了!


作为一个使用推理来综合大量在线信息并为用户完成多步骤研究任务的智能体,Deep Research 旨在帮助用户进行深入、复杂的信息查询与分析。


图片

显然,对于那些在金融、科学、政策和工程等领域从事密集知识工作并需要彻底、精确和可靠研究的用户而言,Deep Research 称得上研究神器了。


项目负责人之一 Zhiqing Sun(孙之清)本科毕业于北京大学计算机科学与技术系。2019 年起在 CMU 语言技术研究所攻读博士学位,现为 OpenAI 研究科学家。


遗憾的是,Deep Research 目前仅供 Pro 订阅用户使用,每月 200 美元着实令很多人望而却步。


所以,在 Deep Research 发布之后,各种开源复现版本纷至沓来。


从 OpenAI 发布的官方博客来看,Deep Research 用到了端到端的强化学习,并且在多个领域的复杂浏览和推理任务上进行了训练,因此才有了现在的性能。


其实,早在去年,来自字节跳动 ByteDance Research 的研究人员就提出了基于强化学习(Reinforcement Learning, RL)的 LLM Agent 框架 ——AGILE。该研究已被NeurIPS接收,这应该是学术界第一个用强化学习做Agent的端到端训练的工作。了解更多内容可以参考机器之心此前报道《》。


接下来,我们看看在一天之内,都有哪些 Deep Research开源复现项目。


一、Open Deep Research


其中一个开源复现版本为「Open Deep Research」。


项目地址:https://github.com/nickscamara/open-deep-research


具体而言,Open Deep Research 是一个 AI 智能体,可以对大量的 web 数据进行推理,该方法没有使用 o3 的微调版本,而是使用了爬虫工具 Firecrawl 的提取 + 搜索功能以及推理模型来深入研究网络。


项目主页还放出了 demo 展示,我们可以发现,在询问 Open Deep Research 关于「2025 年 B2B 领域最大的创业机会」时,Open Deep Research 给出了思考过程,答案也相当完美。


根据项目介绍,我们可以得知 Open Deep Research 背后默认的模型为 gpt-4o,如果你想换个其他模型使用也是可以的,只需几行代码即可切换为 Anthropic、Cohere 等发布的模型。


二、OpenDeepResearcher


另外一个比较热门的复现项目为「OpenDeepResearcher」。


项目地址:https://github.com/mshumer/OpenDeepResearcher


作为一个开源的 AI 智能体,OpenDeepResearcher 可以提供全面的研究。用户只需提供一个主题,该智能体就会展开研究,并返回一份综合报告。


其工作过程非常简单,对于给定的查询,OpenDeepResearcher 执行以下步骤:


  • 执行搜索,查看结果页面,并提取重要信息;
  • 如果它想深入了解,其可以重复此过程,并提出新的查询;
  • 完成后,它会使用上下文生成报告。


三、node-DeepResearch


最后一个复现项目是「node-DeepResearch」,它是由 Jina AI CEO 肖涵(Han Xiao)创建。


他表示,OpenAI 的 Deep Research 只是在 while 循环中进行「搜索 + 读取 + 推理」。他在 nodejs 运行环境中,使用谷歌 gemini-flash 和 jina reader(Jina AI 推出的开源工具,将互联网上的 HTML 网页内容转换为适合 LLM 处理的纯文本格式)进行了复现。


我们来看下运行效果。


下面是「jina ai 最新博客文章内容是什么」(what is the latest blog post from jina ai)的 2/3 步搜索示例:首先找到 jina ai 新闻网站、阅读其内容,然后确定最新帖子内容。


图片

下面视频是关于「who is the biggest, cohere, jina ai, voyage」的 13 步查询,经过搜索、反馈、循环之后,结果是正确的(cohere)。这里视频 2 倍加速。


对于 node-DeepResearch,显然缺少了微调 o3 推理模型的支持。


有人认为,这个项目实现了 OpenAI 准备了半年多的东西所做到的功能。还有人呼吁,赶紧把 UI 做得漂亮一点。


目前,该项目已经收获了近 700 个 Stars。


项目地址:https://github.com/jina-ai/node-DeepResearch


相信后续会有更多类似的开源智能体项目出来。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

我觉得最大的差异应该还是数据和模型的规模吧。OpenAI 的 Deep Research 背后有海量的数据和强大的算力支撑,开源项目很难达到同样的水平,尤其是在处理复杂推理任务时,效果可能会有差距。

对,而且 OpenAI 的 Deep Research 是商业产品,经过了大量的测试和优化,稳定性和用户体验肯定更好。开源项目可能还处于早期阶段,bug 和一些使用上的不便之处在所难免。

还可以考虑引入一些外部工具或服务,比如更强大的搜索引擎、知识图谱等等,来增强项目的功能和性能。

我觉得 LLM Agent 还可以与其他人工智能技术结合,比如计算机视觉、语音识别等等,构建更强大的智能系统,比如可以理解和处理多模态信息的智能助手。

我YY一下,以后会不会出现像钢铁侠里的贾维斯那样的超级智能助手?可以管理我们的生活、工作,甚至可以帮助我们做出重要的决策。

对,社区的力量不容小觑。大家一起贡献代码、分享经验,可以加速项目的迭代和优化。

我比较看好 LLM Agent 在科研领域的应用,可以帮助科研人员快速获取和分析文献、数据,甚至可以参与到实验设计和结果分析中,极大地提高科研效率。

除了数据和模型,我觉得在工程优化方面也会有很大不同。OpenAI 毕竟是大公司,在系统架构、算法优化等方面肯定更成熟,开源项目可能在这方面还有待改进。

我觉得未来可能会出现更加个性化的 LLM Agent,可以根据用户的特定需求和偏好提供定制化的服务,比如个性化学习助手、智能客服等等。

我觉得 LLM Agent 在自动化信息收集和处理方面有很大的潜力,未来可能会在金融、法律、医疗等领域得到更广泛的应用,比如自动化市场分析、法律文件审查、医疗诊断等等。

可以尝试使用更先进的模型架构,或者对现有模型进行更精细的调优。合适的模型和参数可以显著提升性能。

收集更多高质量的数据进行训练肯定是一个重要的方向。数据是模型的基石,数据质量越高,模型的性能就越好。