JManus:面向 Java 开发者的开源通用智能体,让 AI 更近一步

JManus 是一个 Java 开发者友好的开源智能体框架,集成了多 Agent 协作、Web 界面配置和 PLAN-ACT 模式,助力 Java 程序员轻松拥抱 AI。

原文标题:JManus - 面向 Java 开发者的开源通用智能体

原文作者:阿里云开发者

冷月清谈:

JManus 是一个完全以 Java 语言为核心、彻底开源的 OpenManus 实现,旨在让 Java 程序员更便捷地使用 AI Agent。该项目基于 Spring AI Alibaba,拥有接近 3k star,并能无缝集成 Claude 3.5、Qwen3 等多个大模型。JManus 实现了 OpenManus 多 Agent 框架,支持通过网页界面配置 Agent,无缝支持 MCP 协议,原生支持 PLAN-ACT 模式,使得开发者能够轻松构建和管理多个智能体,并与各类外部服务深度交互。文章还介绍了快速运行 JManus 的方法,并鼓励开发者参与开源共建。

怜星夜思:

1、JManus 强调了其完全使用 Java 语言。那么,对于已经熟悉 Python 的开发者来说,迁移到 Java 开发 AI Agent 有什么优势和劣势?
2、JManus 提到了支持 PLAN-ACT 模式。这种模式在实际应用中能解决哪些传统 AI Agent 难以解决的问题?能否举例说明?
3、JManus 鼓励开发者参与开源共建。对于有兴趣参与的 Java 开发者来说,从哪里入手贡献代码或提供建议会比较好?有没有什么推荐的贡献方向?

原文内容

随着 Manus 的火热,开源社区迅速响应,涌现出如 OpenManus 这样无需等待、人人可部署的优秀替代方案,它们通过多智能体协作和工具调用能力,实现了令人瞩目的效果。


正是在这样的大背景下,Spring AI Alibaba JManus 应运而生。它是一个完全以 Java 语言为核心、彻底开源的 OpenManus 实现。


JManus 产生的初心就是 “让Java程序员距离AI更近一点”。希望能够构建一个以 Java 语言为根基,基于 Spring AI Alibaba 的通用 AI Agent 框架/平台,让 Java 程序员朋友们能够更简单容易地使用 Agent 满足自己的工作、日常生活需求。


作为一个 Spring AI Alibaba 项目的子项目,整个项目在 GitHub 上获得接近 3k star,并且在快速增加中。在大语言模型构成方面,JManus 可以无缝集成包括 Claude 3.5、Qwen3 等在内的多个顶级大模型,使得开发者能充分利用各个模型的优势。


核心功能


经过几个月的发展,JManus 已经是一个比较完善的系统,有如下系统特征:


  • 完美实现了 OpenManus 多 Agent 框架
    借助 Spring AI 和 Java 的深度结合,开发者可以轻松构建和管理多个智能体,让复杂任务的分工与协作变得高效且可控。
  • 支持通过网页界面配置 Agent
    开发者和运维人员无需修改底层代码,只需在直观的 Web 管理界面上进行简单操作,就能灵活调整 Agent 的参数、模型和工具,大大提升了易用性和运维效率。
  • JManus 无缝支持 MCPModel Context Protocol)协议
    这意味着 Agent 不仅可以调用本地或云端的大语言模型,还能与各类外部服务、API、数据库等进行深度交互,极大拓展了应用场景和能力边界。
  • JManus 原生支持 PLAN-ACT 模式
    能够让 Agent 具备复杂推理、分步执行和动态调整的能力,适用于多轮对话、复杂决策、自动化流程等高阶AI应用场景。


这些功能特性共同构筑了 JManus 强大的 AI Agent 开发平台,希望使得广大 Java 开发者能够以极低的门槛,快速搭建、扩展和落地面向实际业务的智能体系统。


快速运行

1. 准备环境
  • 下载软件源码

访问项目地址:
https://github.com/alibaba/spring-ai-alibaba/tree/main/spring-ai-alibaba-jmanus,下载或克隆 spring-ai-alibaba-jmanus 模块源码。

git clone https://github.com/alibaba/spring-ai-alibaba
cd spring-ai-alibaba/spring-ai-alibaba-jmanus

  • 确保安装了 JDK 17 或更新版本

可通过命令 java -version 检查本机 JDK 版本。


  • 设置 DashScope API Key

在终端中执行以下命令,配置 API Key(请将 xxxx 替换为你的实际密钥):

export AI_DASHSCOPE_API_KEY=xxxx


2. 运行项目

  • 使用 IDE 运行

将 spring-ai-alibaba-jmanus 作为独立项目导入到你喜欢的 IDE(如 IntelliJ IDEA)中。找到 OpenManusSpringBootApplication 类,右键点击并选择 “运行”。


  • 使用 Maven 运行

mvn spring-boot:run

快速体验效果

程序启动后,会自动打开一个本地 http 页面。


在页面下方输入框中输入:“通过百度查询阿里巴巴最新股价,将结果保存到用户目录本地文件”。



点击“发送”,即可体验多智能体协作带来的智能问答与工具调用能力。



Plan-Act 深度功能体验

点击输入框旁边的计划模式



然后在需求输入位置输入: “通过百度查询阿里巴巴最新股价,将结果保存到用户目录本地文件”。



生成计划,就可以看到详细的执行计划。把里面详细执行计划里面的阿里巴巴都改成 $companyName,然后在附加额外参数部分增加配置 $companyName=百度。 



然后就可以点击执行计划运行任务了。


参与开源共建


JManus 给出了一些颇具建设性的开源通用智能体的建设思路,接下来社区将在智能体交互、执行效果上进行持续优化。


欢迎感兴趣的开发者一起参与共建,一同构建一个以 Java 语言为根基,基于 Spring AI Alibaba 的通用 AI Agent 框架/平台,让 Java 程序员朋友们能够更简单容易地使用 Agent 满足自己的工作、日常生活、业务开发需求。


项目源码地址:

https://github.com/alibaba/spring-ai-alibaba/tree/main/spring-ai-alibaba-jmanus


钉钉交流群:112160014875(钉钉搜索群号加入)

微信阅读源码链接:https://github.com/alibaba/spring-ai-alibaba

我建议从自己熟悉的领域入手。比如,如果你对自然语言处理很熟悉,可以关注 Agent 的对话能力和理解能力;如果对数据库很熟悉,可以研究 Agent 如何更有效地访问和处理数据。另外,可以加钉钉群和大家交流,了解项目的最新进展和方向。

PLAN-ACT 模式能让 Agent 像人一样,先规划再行动,避免盲目执行。比如,让 Agent 预定机票,它可以先确定目的地、时间、预算,然后再去查询和预订,而不是漫无目的地搜索。

先去 GitHub 看一下 issues 列表,找自己感兴趣或者擅长的bug fix或者feature任务。也可以先跑通代码,了解整体架构,然后提出改进建议。文档完善也是很重要的贡献!

传统 Agent 在面对复杂任务时容易迷失方向,PLAN-ACT 就像一个导航仪,让 Agent 始终知道自己在做什么,下一步该怎么做。例如,在客户服务场景中,PLAN-ACT 可以让 Agent 先分析客户的需求,然后制定解决方案,最后逐步执行,而不是简单地回答问题。

PLAN-ACT模式在多步骤任务中优势明显,比如自动化报告生成。Agent可以先规划报告结构,再收集数据,然后撰写内容,最后排版发布。如果不用PLAN-ACT,可能数据收集不全,或者报告逻辑混乱。

作为一个Python老鸟,我感觉Java的优势在于它的强类型和编译时检查,这在大型项目中能减少很多运行时错误,可维护性更高。当然,Python的灵活性和快速原型设计也是不可替代的,看具体应用场景。

优势:Java 在企业级应用中更成熟稳定,方便集成现有系统;劣势:Python 在 AI 领域生态更丰富,学习曲线可能更陡峭。从企业应用角度看,选择Java可能是更稳妥的选择,毕竟很多遗留系统都是Java实现的,方便快速集成!

贡献方向的话,我觉得可以关注智能体的工具调用能力,让智能体能够更方便地使用各种API和服务。另外,也可以研究如何提高智能体的稳定性和性能,毕竟企业级应用对这些要求很高。

Java的优势在于性能和并发处理能力,这在处理高并发的AI服务时非常重要。劣势嘛,可能就是AI相关的库不如Python那么丰富,需要自己造轮子或者依赖其他Java库。