核心概念

什么是 Agent 技能?

模块化能力,赋能 AI Agent 可靠、安全地与真实世界交互。

Agent Skills 是一种简单、开放的格式,用于为 AI Agent 提供新的能力和专业知识。它们就像为新员工准备的入职指南——将程序性知识、组织背景和最佳实践打包成 Agent 可以动态发现和加载的模块化资源。

功能单元

技能是自包含的代码包(Prompt + Tool),赋予 Agent 特定能力,如"网页搜索"或"发送邮件"。

可被发现

采用标准化元数据设计,使 Agent 在用户提出相关任务时能动态"学习"或"加载"它们。

标准化

遵循通用的文件结构(SKILL.md, scripts/),确保在不同 Agent 框架间的兼容性。

Agent Skills 能做什么?

领域专业知识

将专业知识打包成可复用的指令,从法律审查流程到数据分析管道。

新能力

赋予 Agent 新的能力,如创建演示文稿、构建 MCP 服务器、分析数据集等。

可重复工作流

将多步骤任务转化为一致且可审计的工作流程。

跨平台互操作

在不同的兼容 Skills 的 Agent 产品之间复用相同的技能。

渐进式披露:Skills 的核心设计原则

Skills 采用渐进式披露模式,就像一本组织良好的手册——从目录开始,然后是具体章节,最后是详细附录。Agent 只在需要时加载信息,有效管理上下文窗口。

第一层:元数据

启动时,Agent 预加载所有已安装技能的名称和描述到系统提示中。这提供了足够的信息让 Agent 知道何时应该使用每个技能,而无需加载全部内容。

第二层:SKILL.md

如果 Agent 认为技能与当前任务相关,它会通过读取完整的 SKILL.md 来加载该技能。这是第二层详细信息。

第三层及更多:引用文件

随着技能复杂度增加,可能包含太多上下文无法放入单个 SKILL.md。在这些情况下,技能可以在目录中捆绑额外文件,Agent 可以根据需要选择导航和发现。

技能解剖

每个技能都遵循严格的结构,以确保 LLM 的可预测性。它不只是代码,更是一个语义接口。

  • 定义文件 (SKILL.md)
  • Python/Node.js 脚本
  • 资源目录
  • 元数据注册
my-awesome-skill/
├── SKILL.md
├── scripts/
│   ├── browser_tool.py
│   └── util.py
├── assets/
└── references/

技能编写最佳实践

应该做
  • 保持简洁 - 上下文窗口是公共资源
  • 使用渐进式披露模式
  • 为复杂任务提供清晰的工作流程
  • 实现反馈循环和验证步骤
  • 使用一致的术语
不应该做
  • 避免深度嵌套的引用
  • 不要包含时间敏感信息
  • 不要提供太多选项
  • 避免假设工具已安装
  • 不要使用 Windows 风格路径

核心原则:简洁是关键

上下文窗口是公共资源。您的技能与 Agent 需要知道的其他所有内容共享上下文窗口,包括系统提示、对话历史、其他技能的元数据和实际请求。默认假设:Claude 已经非常聪明——只添加 Claude 还没有的上下文。

支持主流平台

主流 Agent 框架均提供原生支持,轻松集成。

准备好构建了吗?

查看官方文档或浏览现有技能以获取灵感。

参考资料