告别凌晨告警:Moltbot+阿里云RDS AI助手,打造你的专属AI运维管家

Moltbot + 阿里云 RDS AI 助手,5分钟打造你的专属数据库 AI 运维管家,解放你的凌晨三点。

原文标题:Moltbot实战:MoltBot+RDS AI助手Skill管理RDS实例

原文作者:阿里云开发者

冷月清谈:

本文介绍了如何将 Moltbot 与阿里云 RDS AI 助手结合,以实现数据库的自动化运维。通过开源 Skill 对接,用户可以利用 Moltbot 的轻量级 Agent 框架和自然语言驱动能力,以及 RDS AI 助手的自动化诊断和运维管理能力,打造一个永不疲倦的 AI 运维管家。

主要步骤包括:

1. 准备工作:安装 Moltbot 基础环境,创建 AI 助手专用 RAM 子账号并授予相应权限,获取 RDS AI 助手的 Skill 代码。
2. 配置 Skill:将 Skill 代码拷贝到 Moltbot 的 Skill 目录,并在 Moltbot 的配置文件中配置 AKSK 认证信息。
3. 运维场景实测:通过 Moltbot + RDS AI 助手的组合,用户可以随时随地管理 RDS 实例,并与其他 Skill 配合使用,例如创建定时任务获取慢 SQL 日志。

使用 Moltbot + RDS AI 助手的优势在于可以将重复劳动交给 AI,让人专注在架构设计等创造性工作。通过开源 Skill,企业可以定制私有化运维知识库,实现数据库的自动化运维。

请注意公网暴露风险和AK/SK泄露的风险,避免让你的机器人变为黑客的工具。

怜星夜思:

1、除了监控和告警,你觉得 AI 还能在数据库运维的哪些方面发挥更大的作用?想象一下,未来的数据库运维工作会是什么样的?
2、文章提到了开源 Skill 的重要性,你认为企业在构建自己的私有化运维知识库时,应该注意哪些方面?
3、文章最后提到了 Moltbot 的公网暴露风险和 AKSK 泄露风险,你有什么好的安全实践建议,可以避免类似的风险?

原文内容

导语

凌晨3点,刺耳的告警声划破寂静——生产环境某核心库响应延迟突增300%。你挣扎着爬起,机械地登录控制台、翻查监控图表、逐行分析慢SQL日志...当终于定位到问题时,天已微亮。这种场景是否似曾相识?Moltbot横空出世席卷全球,让每个人都拥有自己的Jarvis,而Skill又让Jarvis长上了翅膀,拥有了无限的想象可能。DBA苦运维久矣,当Moltbot遇见阿里云RDS AI助手,数据库自动化运维究竟能进化到何种程度。本文将带你5分钟完成开源Skill对接,尝试亲手打造永不疲倦的AI运维管家。


一、为什么选择Moltbot+RDS AI组合?

去年云栖大会,阿里云RDS产品发布了AI助手能力,借助大模型的能力,集数据库管理、分析和运维为一体,上线以来快速积累了用户和口碑,超3w+客户正在使用RDS AI助手运维数据库实例。

Skill范式推出,RDS AI助手快速跟进把AI能力通过开源Skill的方式集成到Claude Code当中。

而今,Moltbot以轻量级Agent框架和自然语言驱动多工具串联能力,持续霸榜GitHub趋势榜,组成了自动化的最后一个板块。而阿里云RDS AI助手skill正是专为其打造的“超级插件”:

  • 自动化诊断能力:将指标直接转化为全面的诊断报告,让实例的运行全貌更加直观

  • 自动化运维管理能力:可通过明确的AI指令完成实例的配置变更、参数调优、索引优化等等

这套全开源的skill[1],让企业能定制私有化运维知识库。我们畅享一下:当你的同事还在写脚本,你已拥有会进化的AI助手。说干就干!

二、5分钟完成对接实战

前置准备

1. 安装Moltbot基础环境。阿里云轻量级应用服务器已经具备了一键部署Moltbot[2]的能力。

2. 创建AI助手专用RAM子账号,授予【AliyunRDSAIFullAccess】策略(最小权限原则)

3. 获取RDS AI助手的skill:

git clone https://github.com/aliyun/alibabacloud-rds-openapi-mcp-server 

步骤一、配置Skill

开源代码中的Skill代码,拷贝到 ~/.clawdbot/skills/,最终在Clawdbot Console的Skill中可以查到相关配置。

cp -r alibabacloud-rds-openapi-mcp-server/skill/alibabacloud-rds-copilot ~/.clawdbot/skills/

执行命令calwdbot skills list | grep alibabacloud确认Skill状态,或在Clawdbot Console的Skill中可以查到相关配置。

图片

步骤二、配置 Skill所需的AKSK认证信息

{
  ....
  "skills": {
    "install": {
      "nodeManager": "npm"
    },
    "entries": {
      "alibabacloud-rds-copilot": {
        "env": {
          "ALIBABA_CLOUD_ACCESS_KEY_ID": "LTA***",
          "ALIBABA_CLOUD_ACCESS_KEY_SECRET": "gqC***"
        }
      }
    }
  }
}


配置完之后就可以跟Moltbot直接对话啦,非常简单。

三、运维场景实测

通过Moltbot+RDS AI助手的组合,您可以随时随地管理您的RDS实例,并跟其他SKILL配合使用,例如,您可以让Moltbot创建一个定时任务,每天早上十点获取所有RDS实例最近24小时的慢SQL日志信息并发送到个人邮箱当中。


写在最后

智能运维不是取代DBA,而是将重复劳动交给AI,让人专注在架构设计等创造性工作。正如某金融客户DBA所说:“当运维知识沉淀为开源skill,每个数据库都值得拥有专属AI管家”——而你的数据库,还在等待凌晨3点的救援吗?

AI时代好奇心和探索心是人人必备的基本素质,面对即将来临的新时代,怎能不心动。至此,RDS AI助手也具备了更加全面的被集成能力和应用场景。


风险提示

  • Moltbot请注意公网暴露风险和AK/SK泄露的风险,避免让你的机器人变为黑客的工具。

  • 本文所有操作示例均在测试环境验证。生产环境执行变更前,且遵循对应的变更管理规范。开源技能持续迭代中,欢迎Star项目获取最新能力:https://github.com/aliyun/alibabacloud-rds-openapi-mcp-server

参考链接:
[1]https://github.com/aliyun/alibabacloud-rds-openapi-mcp-server/blob/main/skill/skill_readme_cn.md
[2]https://help.aliyun.com/zh/simple-application-server/use-cases/quickly-deploy-and-use-moltbot?spm=5176.45303171.J_prbLYvsEQKDdDmwSsbh3D.2.2a4258aco2EO8E

除了用户群体,知识库的内容组织方式也很重要。最好能够建立一套清晰的分类体系,方便用户快速找到所需的信息。同时,内容要保持更新,及时反映最新的技术发展和最佳实践。不然,知识库就成了一个摆设,没人会用。

AI 在数据库运维上的潜力远不止于监控告警。我觉得在容量规划、性能预测、故障根因分析、以及自动化调优方面都有很大的想象空间。未来 DBA 可能会更多地扮演“AI 训练师”的角色,负责优化 AI 模型,而不是像现在这样天天跟慢 SQL 和配置参数死磕。想想,半夜不用爬起来看告警,而是让 AI 自动修复问题,多幸福!

我补充一点,知识库的权限管理也很关键。要确保只有授权用户才能访问和修改知识库的内容,避免信息泄露或误操作。另外,最好能够建立一套知识库的维护机制,定期检查内容的完整性和准确性,及时修复错误和遗漏。

安全第一!首先,Moltbot 最好不要直接暴露在公网上,可以考虑使用 VPN 或防火墙进行隔离。其次,AK/SK 一定要妥善保管,不要明文写在代码里,可以使用环境变量或者专门的密钥管理工具进行存储。最后,要定期轮换 AK/SK,避免长期使用同一个密钥导致风险。

我补充一些:可以启用 Moltbot 的访问控制功能,限制允许访问的 IP 地址或用户。同时,要定期审查 Moltbot 的日志,看看有没有异常访问或操作。另外,要及时关注 Moltbot 的安全漏洞,及时升级到最新版本。

同意楼上的看法!感觉 AI 可以接管很多重复性的工作,比如索引推荐、参数调优、甚至数据迁移。这样 DBA 就能腾出手来做更有价值的事情,比如数据库架构设计、安全策略制定、以及业务需求分析。未来的数据库运维,应该是人机协作,DBA 负责“大脑”,AI 负责“手脚”,效率肯定杠杠的。

我觉得首先要明确知识库的目标用户是谁。是面向所有 DBA,还是只面向特定团队?不同的用户群体,对知识库的内容和形式要求肯定不一样。比如,如果面向初级 DBA,可能需要更详细的步骤和图文说明;如果面向高级 DBA,可能只需要提供关键的原理和配置参数。

还可以考虑使用 RAM 角色来代替 AK/SK。RAM 角色可以赋予 Moltbot 访问阿里云资源的权限,而无需显式提供 AK/SK。这样可以避免 AK/SK 泄露的风险,而且 RAM 角色可以随时撤销或修改权限,更加灵活安全。

我持一个更悲观的看法。虽然 AI 可以提升效率,但如果过度依赖 AI,可能会导致 DBA 们对数据库底层原理的理解越来越浅。万一 AI 出了问题,或者遇到了 AI 无法解决的 Corner Case,恐怕很多人都束手无策。所以,即使有了 AI,DBA 们也不能丢掉基本功啊,要保持学习,才能更好地驾驭 AI 工具。