清华LeapLab开源Cooragent框架:一句话构建你的本地AI协作智能体群

清华LeapLab开源Cooragent框架,一句描述即可构建本地AI协作智能体群,实现智能体自动协作,降低使用门槛,保障数据安全。

原文标题:清华LeapLab开源cooragent框架:一句话构建您的本地智能体服务群

原文作者:机器之心

冷月清谈:

清华LeapLab发布了一款名为Cooragent的开源框架,旨在降低智能体的使用门槛。通过一句简单的描述,用户即可创建个性化的AI智能体,并实现智能体之间的自动协作。Cooragent具有Agent Factory和Agent Workflow两种工作模式,前者允许用户自定义智能体,后者则支持智能体之间的协同工作。该框架采用Prompt-Free设计,降低了Prompt设计的复杂性,并提供MIT License和本地部署选项,保障用户的开放性和数据安全。此外,Cooragent还提供开发者友好的CLI和MCP工具,并兼容Langchain工具链和MCP协议,旨在构建一个人与Agent共同参与的社区生态系统。

怜星夜思:

1、Cooragent框架的Prompt-Free设计是如何实现的?相比传统的Prompt工程,这种设计有哪些优势和局限性?
2、Cooragent框架提到了Agent Factory和Agent Workflow两种工作模式,这两种模式分别适用于什么场景?它们之间有什么联系和区别?
3、Cooragent框架支持本地部署,这对用户来说意味着什么?在数据安全和隐私保护方面,本地部署有哪些优势?

原文内容


本文由清华黄高教授团队完成,第一作者王政是清华 MEM 工程管理硕士,SeamLessAI 创始人,曾任爱奇艺虚拟机云平台负责人,小红书商业化算法工程团队负责人。


刚刚,清华大模型团队 LeapLab 发布了一款面向 Agent 协作的开源框架:Cooragent


你只需要说一句「咒语」:「创建一个 AI 情报收集秘书,为我收集最新的 AI 进展。」


魔法就会产生,Cooragent 就会根据你的个人偏好生成你专属的 AI 情报收集秘书,每天自动浏览网页,收集最重要的情报,总结成你喜欢的图文文档发送给你。


更有趣的是你创造的智能体之间自动组合,创造出无限可能。当然,你还可以将你的智能体发布到社区中,与其他人共享。



  • 项目链接:https://github.com/LeapLabTHU/cooragent

与人协同的 AGI


Cooragent 实际上成为了智能体落地的「最后一公里」。虽然智能体技术层出不穷,但是对于大众来说,智能体的使用门槛依然很高,很难落地。


拿写作智能体为例,通用的写作智能体很难满足不同人的个性化需求,而定制化的智能体开发流程又过于复杂,导致智能体很难落地到每个人的生活和工作中。


Cooragent 通过对话生成可协作的智能体,其本质一种可编辑的 AGI - 即让智能体通过 AGI 的方式产生,但同时可以随时保持其可编辑性,与人协作,让智能体真正落地到每个人的生活和工作中。


 Agent 技术层面来看,Cooragent 是一个基于 Agent 的协作框架。通过动态上下文理解与自主归纳能力,Cooragent 彻底摒弃了传统 Agent 框架对人工设计 Prompt 的依赖。


系统利用深度记忆扩展和实时环境分析,自动生成高精度任务指令,显著降低使用门槛并提升智能体的适应性。它允许你通过一句话创建一个具备强大功能的智能体,并与其他智能体协作完成复杂任务。


无限可能


Cooragent 由两种工作模式Agent Factory  Agent Workflow


Agent Factory 模式下,你只需要你对智能体做出描述,Cooragent 就会根据你的需求生成一个智能体,系统的会自动分析用户需求,通过记忆和扩展深入理解用户,省去纷繁复杂的 Prompt 设计。Planner 会在深入理解用户需求的基础上,挑选合适的工具,自动打磨 Prompt,逐步完成智能体构建。智能体构建完成后,可以立即投入使用,但你仍然可以对智能体进行编辑,优化其行为和功能。


Agent Workflow 模式下你只需要描述你想要完成的目标任务,Cooragent 会自动分析任务的需求,挑选合适的智能体进行协作。Planner 根据各个智能体擅长的领域,对其进行组合并规划任务步骤和完成顺序,随后交由任务分发节点 publish 发布任务。各个智能领取自身任务,并协作完成任务。


Cooragent 可以在两种模式下不断演进,从而创造出无限可能。


Prompt-Free 设计


Prompt 本身越来越成为一种负担。Prompt 设计需要考虑的因素太多,用户很难在短时间设计出合适的 PromptCooragent 采用 Prompt-Free设计,通过 Agent 的协作,深入理解上下文,自主归纳环境因素,自动生成 Prompt,从而省去 Prompt 设计。


MIT License 和本地部署


Cooragent 坚信开放与安全的力量,因此我们选择采用极其宽松且商业友好的 MIT License 进行开源。这种彻底的开放性旨在最大限度地降低使用门槛,并激励社区成员共同参与创新与贡献,共建繁荣的智能体生态。


更重要的是,Cooragent 提供了一键本地部署的能力。用户可以通过极其简单的步骤,在自己的个人电脑或私有服务器上快速部署和运行整个系统。这不仅极大地简化了安装配置过程,让用户能够迅速上手体验,更从根本上解决了数据安全和隐私的顾虑。


通过本地部署,用户所有数据——包括智能体配置、交互历史、处理内容等——都将完全保留在您自己的设备上,用户对自己的数据拥有绝对的控制权,无需担心数据泄露或被第三方平台滥用的风险。

快速安装

# 克隆仓库
git clone https://github.com/SeamLessAI-Inc/cooragent
cd cooragent

用uv创建并激活虚拟环境

uv python install 3.12
uv venv --python 3.12

source .venv/bin/activate  # Windows系统使用: .venv\Scripts\activate
uv run src/service/app.py   

安装依赖

uv sync

配置环境

cp .env.example .env

编辑 .env 文件,填入你的 API 密钥

运行项目

uv run cli.py


开发者友好Cli + MCP



Cooragent 提供了一系列开发者工具,帮助开发者快速构建智能体。通过 CLI 工具,开发者可以快速创建,编辑,删除智能体。CLI 的设计注重效率和易用性,大幅减少了手动操作的繁琐,让开发者能更专注于智能体本身的设计与优化。


通过 MCP 工具,开发者可以快速链接 MCP 社区,获取最新的工具。开发者可以浏览和获取由官方或社区贡献的预构建智能体模板、功能组件、工具插件、数据集或优化过的模型,将自己开发的优秀智能体、工具或组件发布到 MCP,与其他开发者共享,共同建设生态。


首个Agent 与人共同参与的社区


Cooragent 不仅仅是一个强大的智能体构建和协作框架,它更开创性地提出了一个全新的社区概念:一个人与 Agent 共同参与、互动、贡献的生态系统。这超越了传统开发者社区仅限于人际交流的模式,将智能体本身也视为社区的一等成员。


这种人机共融」的社区模式打破了传统软件生态的边界。它不仅加速了知识的创造和传播,激发了前所未有的协作模式,更让智能体真正「活」了起来,从单纯的工具转变为社区中积极的参与者和贡献者。Cooragent 致力于构建这样一个充满活力、互相赋能的未来社区,让人类和他们创造的智能体共同塑造一个更加智能、高效的世界。


一起看看 Cooragent 的神奇之处


让我们通过几个例子来一起看看 Cooragent 的神奇之处。


构建我的漫画工作室


咒语」:构建一个漫画师和一个剧本创作师,让他们协作完成一个漫画:一个小男孩在森林里迷路,遇到了一只小狗,他们一起努力走出森林。



构建我的AI情报秘书


「咒语」: 为我创建一个AI 前沿科技追踪秘书,整理 AI 前沿科技信息,形成文字和图表汇报给我。



使用 Cli 工具


进入 cooragent 命令工具界面


python cli.py


一句话创建小米股票分析智能体


run -t agent_workflow -m '创建一个股票分析专家 agent,分析过去一个月的小米股票走势,并预测下个交易日的股价走势,并给出买入或卖出的建议。'


使用一组智能体协作完成复杂任务


run -t agent_workflow -m '综合运用任务规划智能体,爬虫智能体,代码运行智能体,浏览器操作智能体,报告撰写智能体,文件操作智能体为我规划一个 2025 年五一期间去云南旅游的行程。首先运行爬虫智能体爬取云南旅游的景点信息,并使用浏览器操作智能体浏览景点信息,选取最值得去的 10 个景点。然后规划一个 5 天的旅游的行程,使用报告撰写智能体生成一份旅游报告,最后使用文件操作智能体将报告保存为 pdf 文件。'


面向私有化的架构设计


Cooragent 从一开始就将数据主权和部署灵活性作为核心设计原则。我们深知,对于许多企业和个人用户而言,能够完全掌控自己的数据、在私有环境中安全运行是至关重要的。因此,Cooragent 的整体架构都围绕着「私有化优先」的理念进行构建。


  • 核心引擎本地运行: Cooragent 的核心调度、任务规划、Agent 管理和执行引擎均设计为在用户本地环境(个人电脑、私有服务器或内部网络)运行。它不强制依赖任何外部云服务来执行其基本功能,确保了操作的独立性和自主性。


  • 数据不出域:所有的用户数据,包括但不限于:


    • 智能体的配置和定义

    • 用户与智能体的交互历史和日志

    • 智能体处理和生成的内容

    • 连接的本地工具或数据源信息


全面的兼容性


Cooragent 在设计上追求极致的开放性和兼容性,确保能够无缝融入现有的 AI 开发生态,并为开发者提供最大的灵活性。这主要体现在对 Langchain 工具链的深度兼容、对 MCP (Model Context Protocol) 协议的支持以及全面的 API 调用能力上。


  • 深度兼容 Langchain 工具链:


    • 可以在 Cooragent 的智能体或工作流中直接使用熟悉的 Langchain 组件,如特定的 PromptsChainsMemory 模块、Document LoadersText Splitters 以及 Vector Stores 等。这使得开发者可以充分利用 Langchain 社区积累的丰富资源和既有代码。


    • 平滑迁移与整合如果您已经有基于 Langchain 开发的应用或组件,可以更轻松地将其迁移或整合到 Cooragent 框架中,利用 Cooragent 提供的协作、调度和管理能力对其进行增强。


    • 超越基础兼容: Cooragent 不仅兼容 Langchain,更在其基础上提供了如 Agent FactoryAgent Workflow、原生 A2A 通信等高级特性,旨在提供更强大、更易用的智能体构建和协作体验。您可以将 Langchain 作为强大的工具库,在 Cooragent 的框架内发挥其作用。


  • 支持 MCP (Model Context Protocol):


    • 标准化交互: MCP 定义了一套规范,用于智能体之间传递信息、状态和上下文,使得不同来源、不同开发者构建的智能体能够更容易地理解彼此并进行协作。


    • 高效上下文管理通过 MCP,可以更有效地管理和传递跨多个智能体或多轮交互的上下文信息,减少信息丢失,提高复杂任务的处理效率。


    • 增强互操作性对 MCP 的支持使得 Cooragent 能够更好地与其他遵循该协议的系统或平台进行互操作,构建更广泛、更强大的智能生态系统。


  • 全面的 API 调用支持:


    • Cooragent 的核心功能几乎都通过全面的 API (
      RESTful API) 暴露出来,为开发者提供了强大的编程控制能力。


    • 程序化管理通过 API 调用,您可以自动化智能体的创建、部署、配置更新、启动/停止等全生命周期管理。


    • 任务集成将 Cooragent 的任务提交和结果获取能力集成到您自己的应用程序、脚本或工作流引擎中。


    • 状态监控与日志通过 API 获取智能体的实时运行状态、性能指标和详细日志,方便监控和调试。


    • 构建自定义界面利用 API,您可以为 Cooragent 构建自定义的前端用户界面或管理后台,满足特定的业务需求和用户体验。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

Cooragent支持本地部署简直太赞了!现在各种AI应用都往云上跑,总感觉自己的数据像是在裸奔。本地部署就像给自己建了一个保险箱,把所有数据都锁在里面,安全感满满。

好处嘛,我觉得最主要的就是隐私。谁也不想自己的聊天记录、想法、创作内容被别人偷窥。本地部署就能避免这种情况,所有数据都掌握在自己手里。

另外,本地部署也更灵活。你可以根据自己的需求调整配置,不用受限于云服务商的规则。而且,网速也更快,毕竟数据就在本地,不用经过漫长的网络传输。

所以,对于注重隐私和安全的用户来说,本地部署绝对是首选!

本地部署对于注重数据安全和隐私的用户来说,简直是福音。这意味着你的所有数据,包括智能体的配置、交互记录、处理内容等等,都存储在你的本地设备上,而不是上传到云端服务器。这样你就可以完全掌控自己的数据,不用担心数据泄露或者被第三方滥用的风险。

优势主要体现在以下几个方面:

* 数据主权:你对自己的数据拥有绝对的控制权,可以自主决定数据的存储、处理和使用方式。
* 隐私保护:避免了将敏感数据上传到云端,减少了数据泄露的风险。
* 合规性:对于一些有严格数据合规要求的行业,本地部署可以更好地满足合规要求。
* 性能:本地部署可以减少网络延迟,提高数据处理速度。

总的来说,本地部署为用户提供了更高的安全性和隐私保护,让用户可以更放心地使用智能体技术。

Cooragent的Prompt-Free设计确实挺有意思的。它不像传统Agent那样依赖于人为编写的Prompt,而是通过让Agent们互相协作,自己生成Prompt。这就像一个团队,每个人都有自己的特长,大家一起讨论,最终形成一个完整的方案。

优点嘛,我觉得是更灵活,更智能。Agent可以根据实际情况动态调整Prompt,而不是死板地执行预设的指令。而且,也更省事,不用费心思去写Prompt了。

缺点嘛,可能就是不太可控。毕竟,Agent自己生成的Prompt,你不知道它会是什么样的。万一它跑偏了,或者理解错了你的意思,那就麻烦了。

所以,我觉得这种设计更适合一些模糊的、探索性的任务。对于那些需要精确控制的任务,还是用传统的Prompt工程更靠谱。

Cooragent的Prompt-Free设计,核心在于通过Agent的协作和深度上下文理解能力,来规避人工设计Prompt的需要。传统Prompt工程需要人工精心构造Prompt,这要求用户对模型和任务都有深入的理解。

优势:
* 降低用户门槛:无需Prompt工程专业知识,用户只需描述目标。
* 提高Agent适应性:Agent能根据环境和上下文动态调整行为。

局限性:
* 可控性降低:自动生成的Prompt可能不完全符合预期。
* 任务复杂度限制:对于高度定制化或复杂的任务,可能不如人工Prompt有效。

个人认为,这种设计更适合于通用型、探索型的任务。对于特定领域的专业任务,可能还需要结合人工Prompt进行优化。

我来尝试分析下Agent Factory和Agent Workflow两种工作模式。Agent Factory,顾名思义,是用来“生产”Agent的。它更适合用于创建定制化的、具有特定功能的智能体。例如,你想创建一个专门用来分析股票的Agent,或者一个专门用来写诗的Agent,就可以用Agent Factory模式。

Agent Workflow,则是用来组织和协调多个Agent协同工作的。它更适合用于完成复杂的、需要多个智能体共同参与的任务。例如,你想让Agent帮你规划旅行路线,就需要一个Agent负责搜索景点信息,一个Agent负责制定行程安排,还有一个Agent负责预订酒店和机票,这些Agent需要通过Agent Workflow模式进行协作。

联系方面,我认为Agent Factory是Agent Workflow的基础。只有先通过Agent Factory创建了各种各样的Agent,才能在Agent Workflow模式下进行协同工作。

区别方面,Agent Factory关注的是单个Agent的构建,而Agent Workflow关注的是多个Agent的协作。Agent Factory是“造物”,Agent Workflow是“用物”。

Agent Factory和Agent Workflow,可以理解为“构建”和“使用”的关系。Agent Factory用于定义和创建具备特定技能的Agent,就像软件开发中的类定义。而Agent Workflow则用于组织和协调这些Agent,完成特定的任务流程,类似于软件中的函数调用和流程控制。

适用场景:
* Agent Factory:适用于需要定制化Agent的场景,例如创建特定领域的专家Agent,或者具有独特个性的Agent。
* Agent Workflow:适用于需要多个Agent协作完成复杂任务的场景,例如自动化报告生成、智能客服流程等。

联系与区别:
* 联系:Agent Workflow依赖于Agent Factory创建的Agent。
* 区别:Agent Factory关注Agent的构建,而Agent Workflow关注Agent的协作和任务执行。

本地部署,意味着用户可以将Cooragent的核心引擎运行在自己的设备或服务器上,而无需依赖外部云服务。这对用户来说,最大的意义在于数据主权和安全性的提升

优势:
* 数据不出域:所有数据都保留在用户自己的设备上,避免了数据泄露或被第三方滥用的风险。
* 合规性:满足对数据安全和隐私有严格要求的行业或用户的需求。
* 定制性:用户可以根据自己的需求,灵活配置和优化系统。

总的来说,本地部署为用户提供了更大的控制权和安全性,尤其适用于对数据安全和隐私高度敏感的场景。

Agent Factory就像一个智能体制造工厂,你告诉它你想要什么样的智能体,它就给你生产出来。比如,你想要一个会画画的智能体,或者一个会讲笑话的智能体,都可以通过Agent Factory来创建。

Agent Workflow就像一个任务调度中心,你告诉它你想要完成什么任务,它就会把任务分解成多个步骤,然后分配给不同的智能体去完成。比如,你想要写一篇论文,它就会让一个智能体负责查资料,一个智能体负责写草稿,一个智能体负责修改润色,最后完成一篇完整的论文。

所以,Agent Factory是用来创造智能体的,Agent Workflow是用来使用智能体的。一个是“创造”,一个是“使用”,二者相辅相成,共同构成了Cooragent的核心功能。