从饺子馆到写作流水线:为什么“万物皆 Skill”正在成为 AI 使用的新思路

重复三次的工作,就值得封装成 AI skill。

原文标题:万物皆 Skill

原文作者:图灵编辑部

冷月清谈:

文章从一家饺子馆把营业时间、Wi-Fi 查询、排队取号封装成 AI skill 的例子出发,提出“万物皆 Skill”的观点:只要一个能力能被自然语言描述清楚触发条件、输入和输出,就可以被封装成可调用模块。作者结合自己的英语学习、知识库搭建、写作流程等实践,提出“事不过三,三则 skill”——重复出现的工作应被沉淀为 skill。文章还按调用意图把 skill 分成六类:干活、连接、想事、把关、分身、调度,并强调分类不必完全严密,关键是帮助人们形成封装能力的直觉。后半部分介绍宝玉的 baoyu skills 及其新书《图解 Skill:AI 提效实战指南》,认为其对初学者和深度 AI 用户都有实践参考价值。
    <div data-wct-type="discuss-section">
        <h3 data-wct-type="discuss-title">怜星夜思:</h3>
        <div data-wct-type="article-discuss">1、你觉得“事不过三,三则 skill”适合普通人吗?还是更适合程序员?<br>2、文章里把 skill 分成“干活、连接、想事、把关、分身、调度”,你最看好哪一种?<br>3、如果一家饺子馆都能做 skill,那线下小店真的有必要做自己的 AI skill 吗?<br>4、把个人写作、学习、知识管理都拆成 skill,会不会让人越来越依赖 AI?<br></div>
    </div>
</div>
<div data-wct-type="original-content">
    <h2 data-wct-type="original-content-header">原文内容</h2>
    <!-- 原文具体内容 -->
    <div style="">

两个月前,朋友给我发了张截图。

金谷园饺子馆的 skill[1]。对,就是一家饺子馆——给自己的店做了个 skill。装上之后,你的 AI 助手能帮你查这家饺子馆的营业时间、查 Wi-Fi、对接美团排队取号。

我看到的时候愣了一下。不是因为技术有多复杂。让我惊讶的是:这也能做成个 skill?

一家饺子馆,都能变成一个可以被调用的能力模块。你不需要打开美团搜索,只需要说"帮我排个号",它就被调用了。

那个瞬间我突然意识到,skill 的边界比我以为的大得多。它不只是帮你做翻译、帮你查资料、帮你写代码、帮你写日报(又压上了)。任何能力——只要你能在自然语言里描述清楚"它是什么、什么时候触发、输入什么、输出什么"——都可以被封装成 skill。

万物皆 skill。

事不过三

其实不止饺子馆。回头看,我自己的很多想法,最后都变成了 skill。

还拿我的举例。其实一开始我的操作很简单——用Claude Code打开一个空 folder,敲入需求,让它帮我把事搞定。

我的需求是,输入一张孩子的英语完形填空或阅读的题目照片,它帮我根据错题把生词记录下来,然后用这些生词生成一篇全新的完形或阅读。它跟我沟通了几个回合,写下了一个 spec,然后生成了代码。写完之后它问我,要不要总结成一个skill,方便下次调用?

这时我才意识到,原来这些将会重复的发生的需求,都可以沉淀为一个 skill。

后来这个体验反复出现。我搭建个人知识库的时候,下载文章、下载视频、转 markdown,每个重复操作也都变成了 skill;我的写作流程,从选题到调研到写初稿到审校到排版,每个角色都变成了一个 skill,最后用一条 pipeline skill 把它们串起来。

这时我意识到一个规律:遇到重复的工作,就把它总结成 skill。

事不过三,三则 skill。

这个规则其实不新鲜。软件工程里有个 Rule of Three原则[2]。第一遍实现,第二遍复制,第三遍重构。也就是我们常说的"事不过三,三则重构"。

你看,那些古法编程时代的原则和模式,在 AI 时代仍然有用。

六种 skill 面孔

既然万物皆 skill,那 skill 本身有没有类型?有。但不是按"功能""工具"这种模棱两可的维度去分,而是按你调用它的时候,你到底在要什么

干活:帮我把这事做了

最常见的类型。你下指令,它出结果。

/translate[3] 在 skills.sh 上装了 16K 次——给它一段文字,它给你翻译。/refactor 也是:给代码,出重构方案。你不需要想它怎么做的,调用就行。

它就是 skill 生态里的蓝领。不废话,就是干。

连接:帮我够到外面那个东西

干活是内部变换,连接是打通外部。

MCP integration[4] 装了近 10K 次——帮你接上各种外部服务。web-access 帮你打开浏览器,jina-cli 帮你抓网页。金谷园饺子馆的 skill 也是连接者——连接美团 API。

这类 skill 的价值不在于它自己能做什么,而在于它让你能触达原本够不到的地方。

想事:帮我换个角度想

这类 skill 不给你答案,它给你看问题的方式。

deep-think[5]、brainstorm、decision-tree——进去的时候你带着一个模糊的问题,出来的时候问题被拆成了结构化的 pieces。我自己的 topic-planning skill 也是这种:它不帮你写文章,它帮你搞清楚"这篇到底想说什么"。

想事型 skill 和干活型刚好相反。干活是减少你的工作量,想事是增加你的清晰度。

把关:帮我检查这事对不对

它一般是一个流程的最后一道门。代码审查、事实核查、风格检查——它的工作就是说"不行"。

nemo-guardrails[6] 干的就是划边界:什么不能说、什么不能做。我的 fact-checking skill 也是把关者——扫一遍文章里所有事实性陈述,按置信度分级,告诉你哪些与事实不符。

好的把关者不只说"不行",它会告诉你为什么。差的那种只会拦,不会教。

分身:帮我借用别人的脑子

这个类型有点上头。

persona[7] skill 让你模拟特定角色的思维方式。你用乔布斯的 skill 评审产品设计,本质上是在问:"如果乔布斯看到这个,他会怎么骂?"以前你要读一堆传记才能勉强「模拟」一个人的思维。现在一个 prompt 就搞定了。

科技博主"数字生命卡兹克"开源了自己的写作skill khazix-writer[8]。装上之后,AI 写出来的东西,读着就像他写的。不是抄他的文章,是借他的脑子想。

调度:帮我协调其他 skill

这个类型现在还小,但可能是未来最重要的。

pipeline-orchestrator[9] 干的事很简单:决定什么时候调用谁、怎么处理冲突、怎么汇总结果。我自己的 writing-pipeline 也是调度者——8 个写作 skill,它不亲自写、不亲自审,只负责让对的人在对的时间做对的事。

skill 少的时候不需要调度者,就像一个人吃饭不需要项目经理。但当你的工作流节点 从 5 个变成 50 个,没有调度者就是混乱。

没有调度者的 skill 群只是小提琴独奏。有了调度者,才变成管弦乐队。

这六种不是非此即彼的格子。同一段代码分析能力,加上"请严格检查并指出问题"就是把关,加上"请用乔布斯的方式评价"就是分身,加上"请重构并输出最佳实践"就是干活。底层能力一样,只是 framing 不同。skill 的类型不是由它"是什么"决定的,而是由它"被怎么用"决定的。

一个不够 MECE 的分类

说实话,这个分类不够 MECE(相互独立,完全穷尽)。

比如"把关"和"干活"的边界模糊——/code-review 到底是帮我干活还是帮我把关?比如"连接"和"干活"也有重叠——翻译 skill 内部是不是也在"连接"翻译 API?

但这些不重要。分类的目的不是穷尽所有可能性,是帮你建立一种直觉:当你有一个想法,你能快速判断它适合变成哪种 skill。

或者更简单——你甚至不需要判断类型。只要你发现自己第三次重复同一件事,就把它变成 skill。类型只是事后归纳,"事不过三,三则 skill"才是事前行动准则。

回到开头那个问题:一家饺子馆都能做成 skill,你手上的哪些想法也能?

可能比你以为的多。

如何编写 Skill ?

序言结束,”正文“开始。

你可能没听说过宝玉,但你一定使用过 baoyu skills[10]。它在 GitHub 上有2万多个 star。我所有文章中的配图,全都是用 baoyu skill 生成的。

十几年前初识宝玉大大时,他还是微软MVP。我们在博客园和微博上讨论过很多 .NET 技术问题。多年之后,他已经华丽转身为 AI 专家,并且把自己制作 skill 的心路历程写成了一本书——《图解 Skill:AI 提效实战指南》。(你完全有理由相信书中的配图就是用他自己的 skill 生成的。)

我在上周四拿到了样书,周末两天很快就读完了。与如今市面上大量用 AI 撰写的 AI 书籍不同,这本书完全没有任何AI味道,就像是一位资深专家在娓娓道来。不管是初学者还是深入使用 AI 的开发者,都能从中学到很多实用的技能和思维方式。

我在看完第5章的示例之后,大受启发,立马改进了自己的写作 skill 工作流。

你可以点击下面的链接直接购买本书。

快来一起愉快地编写 skill 吧。

说明一下,当前宝玉老师的《图解Skill》多数渠道已经断货,当前其他渠道是预售状态,京东也不多了,先抢为敬吧~  建议预售加购,预售的朋友们,周三之后开始陆续发货!(内部消息)


引用链接

[1]金谷园饺子馆 skill:https://github.com/JinGuYuan/jinguyuan-dumpling-skill
[2]Rule of Three原则:https://en.wikipedia.org/wiki/Rule_of_three_(computer_programming)
[3]translate skill:https://skills.sh/jimliu/baoyu-skills/baoyu-translate
[4]MCP integration:https://skills.sh/anthropics/claude-code/mcp-integration
[5]deep-think:https://skills.sh/wangyendt/wayne-skills/deep-think
[6]nemo-guardrails:https://skills.sh/davila7/claude-code-templates/nemo-guardrails
[7]persona:https://skills.sh/membranedev/application-skills/persona
[8]khazix-writer:https://skills.sh/jimliu/baoyu-skills/khazix-writer
[9]pipeline-orchestrator:https://skills.sh/levnikolaevich/claude-code-skills/ln-1000-pipeline-orchestrator
[10]baoyu skills: https://github.com/JimLiu/baoyu-skills

我喜欢“分身”,听起来最中二但也最有意思。让乔布斯骂产品、让鲁迅改文案、让投资人视角看商业计划书,虽然不一定准,但能逼你换个脑子思考。

2 个赞

回答依赖 AI 这个问题:真正的问题不是依赖,而是黑箱。你知道 skill 在做什么、标准是什么、哪里可能出错,就还可控;如果只是点一下等结果,那就容易变成“AI 说啥是啥”。

1 个赞

回答“事不过三,三则 skill”:我觉得普通人也适合,只是表现形式不一定是写代码。比如每周都要整理会议纪要、每月都要做报销说明、每天都要给客户回类似问题,这些都可以先整理成固定提示词或流程模板。程序员只是更容易把它做成可复用工具。

2 个赞

适合普通人,而且越普通越适合。程序员早就有脚本、函数、自动化了,反而是普通办公场景还在靠人肉搬砖。把“帮我把这些客户反馈分成三类”这种事固化下来,幸福感提升很明显。

2 个赞

我站程序员这边一点。普通人当然能用,但真正做成“可调用、可维护、可组合”的 skill,还是需要一点抽象能力。不是说要会写代码,而是要能说清楚:什么时候触发、输入是什么、输出长什么样。这个其实挺难。

1 个赞