type
Post
status
Published
date
Jan 27, 2026
slug
summary
预测,思考,想法,记录
tags
category
读书笔记
icon
password
写在开头,最近我的时间线上总是 Skill,clawdbot,然后看着看着就很焦虑。只能说看书就很令人平静,于是我找了这本《黑客与画家》的书。
冒出了一些想法和点子,所以来分享一下。
最近 clawbot 大火。一个7*24小时的 AI Agent 能持续的为你生成代码,搜索资料,绘制图表。
但是这种行为它对吗?我觉得可能是错的。
不得不说,我们一直都希望AI越来越牛,更便宜的模型,更快速的输出更智能的回复,更广阔的知识库。
但是好像没有人问AI应该强大在哪里。
保罗·格雷厄姆在《黑客与画家》中讲过一个故事。早期互联网公司 Viaweb 发现,大部分公司的 IT 部门效率低下。因为缺乏竞争压力,只有把这些工作外包给专门靠此生存的服务商,才能获得最好的服务。
我认为这个逻辑对AI Agent同样适用。
AI Agent 不应该什么都做。它应该专注于思考与决策,把具体的能力外包出去。
只有把非核心的业务进行外包,才能最大化效率。也就是说,AI Agent 的核心竞争力是进行思考与决策。它需要能进行问题的深入理解,规划出最好的行动路径,通过有价值的问题,创造有价值的解决方案。
事实上,我并不认为AI需要最顶级的计算绘图、搜索和代码生成的能力。它的能力应该是通过像API或者函数调用一样,通过专门的工具提供的。而不是直接由它本身产生.
AI它需要的是决策什么场景,调用什么工工具,然后制定这个路径。具体的实施细节,如一些JSON数据解析这种脏活类活都应该由专门的模块和代码进行规范化的处理完成。
如果AI Agent深陷于这种细节上的把控。可能他会失去这本书描述的画家的灵感和视野。
那么,怎么进行外包呢?答案也许就在我们的眼前 Skill。我不是说一定是这个Skill的东西,但它必须是一种可以被轻松理解和调用的模块化、专业化、可重复化的一个工具包。
在我看来,MCP 相当于工具, Skill 相当于说明书,而 Agent 就是一位阅读了许多说明书,并有了各种工具的一个进行决策的谋士。
格雷厄姆在预测"一百年后的编程语言"时说:“优秀函数库的重要性将超过语言本身……编程语言是供程序员使用的,而函数库就是程序员需要的东西。”
Agent 它不需要知道底层实现的是一个什么功能,它只需要有这么一个库可用就好了。而 Skill 就是那个可以复用的有着说明书的库。
这种模式允许 Agent 专注于逻辑编排,将具体繁琐的执行细节外包给已经写好的脚本。这种直接调用现成的库,是完成一次性或者特定任务的高效解决方法。
2022年的时候,AI 只是一个对话工具。但现在AI有了搜索,绘图,视觉理解的能力。它们扩展了自己语言的边界。
我之语言边界,我之世界边界
当 Agent 有了 Skill 之后。他获得了新的手脚和工具,它通过指令调用 Skill 的底层脚本,就会执行一系列可控的复杂操作。
Agent 应该类比于一个高级的抽象语言。他不关心底层的代码,而是操作更高级的抽象的概念。比如事情的意图,任务的目标和对事物的价值判断。
但在这之前,Agent 必须要理解,或者说更好的理解这些工具能做什么,不能做什么。人的品位难得可贵,Agent 更是如此。
他需要知道什么时候用哪个 Skill ,什么时候该不该用,怎么判断输出的质量,能不能评估一个 Skill 是否满足需求。它需要能动态进行能力组合,使用各种不同的工具解决一些复杂的问题。
Agent 可以就像画草图一样,专注于思维链的调整。当发现某些工具不好用的时候,替换工具集合,不需要重新训练模型。
因此,Agent 模型必须保持轻量和专注,需要能灵活地调动各种外包的能力,用来解决复杂问题。
现在聊完了 Agent 可以干什么?那我们呢?
我们让AI专注于思考,将能力进行外包。我们同样也将我们自己的能力进行了外包。
这种方式会让 Agent 可能陷入只道怎么做,不知道为什么这么做的境地。
我们自己也是如此。当我们过度依赖工具,无论是AI搜索引擎还是各种自动化脚本,我们会不会也变成就是只知道怎么做,而不知道为什么这样做的人?
我们现在用AI生成代码,润色文本,但不再理解代码的逻辑,思想的逻辑;我们用搜索引擎查找答案,在而不考虑思考问题的本质。我们的能力是否在增加呢?
AI和我们同样都需要保持思考的能力。它不能只是读取说明书,然后执行。它需要有一种能理解问题本质的能力,判断解决方案的合理性,有必要的时候,质疑工具甚至替换工具。
所以在我眼里,Agent 应该是什么?
他应该是一个hacker,他是一个思考者、质疑者,一个能理解问题、规划路径,并做出判断的谋士。
Agent 如果能通过准确的决策来解决复杂的问题,这种行为比单一的聊天能力更具价值。
Skill,现在这个新出的概念便是外包方式的一种。Agent 读取 Skill 这个说明书,理解它的能力边界,然后结合特定的 skill 内部脚本进行操作。这种模式允许了 Agent 的专注和轻量化,也同时赋予了 Agent 强大的执行。
而到了现在,可能你还在使用 clawdbot 这种7*24小时的 AI Agent。但我希望以后它并不是在盲目的执行你给它的各种任务。
你需要思考为什么做这件事,这种事对吗?有没有更好的方?而它同样也能反馈给你他的想法。
这才是 Agent 应该成为的样子。也是我们自己应该做到的样子。