Claude推出Skills功能及AgentSkills开发指南

现在,Claude 可以新增「技能」了!

Claude推出Skills功能及AgentSkills开发指南-2

Anthropic 刚刚为 Claude 推出了 Skills 功能,这个新能力让 Claude 能够动态加载专门的指令、脚本和资源,从通用 AI 助手变身为各领域的专业助手。

此次的功能升级,将进一步 改变我们定制 AI 的方式 。

什么是 Agent Skills?

Skills 本质上是一个包含指令、脚本和资源的文件夹,Claude 可以在需要时动态发现并加载它们来完成特定任务。

Claude推出Skills功能及AgentSkills开发指南-3

想象一下,这就像给新员工准备入职指南:

你不再需要为每个用例构建零散的、定制化的 Agent,现在,任何人都可以通过捕获和分享他们的程序性知识,用可组合的能力来专门化他们的 Agent。

核心特性

Skills 具有几个关键特点:

可组合 :Skills 能够堆叠在一起,Claude 会自动识别需要哪些 Skills 并协调它们的使用。

可移植 :使用相同的格式,一次构建,就能在 Claude 应用、Claude Code 和 API 中使用。

高效 :只在需要时加载需要的内容。

强大 :可以包含可执行代码,用于那些传统编程比 token 生成更可靠的任务。

工作原理

让我们通过一个真实的例子来看看 Skills 是如何工作的:支持 Claude 最近推出的文档编辑能力的 PDF 技能。

Claude推出Skills功能及AgentSkills开发指南-4

技能的结构

最简单的 Skill 是一个包含 SKILL.md 文件的目录。

这个文件必须以包含必需元数据的 YAML frontmatter 开头: name 和 description 。在启动时,Agent 会将每个已安装技能的名称和描述预加载到系统提示中。

Claude推出Skills功能及AgentSkills开发指南-5

这个元数据是 渐进式披露 的第一层:它提供了足够的信息让 Claude 知道每个技能何时应该被使用,而不需要将所有内容加载到上下文中。

文件的实际内容是第二层细节。

如果 Claude 认为该技能与当前任务相关,它会通过将完整的 SKILL.md 读入上下文来加载该技能。

随着技能变得更加复杂,它们可能包含太多上下文无法放入单个 SKILL.md ,或者只在特定场景中相关的上下文。在这些情况下,技能可以在技能目录中捆绑额外的文件,并从 SKILL.md 中按名称引用它们。

Claude推出Skills功能及AgentSkills开发指南-6

在 PDF 技能中, SKILL.md 引用了两个额外的文件( reference.md 和 forms.md ),技能作者选择将它们与核心 SKILL.md 一起捆绑。

通过将表单填写指令移到单独的文件( forms.md ),技能作者能够保持核心技能的精简,相信 Claude 只会在填写表单时才读取 forms.md 。

渐进式披露设计

渐进式披露 是让 Agent Skills 灵活且可扩展的核心设计原则。

就像一本组织良好的手册从目录开始,然后是具体章节,最后是详细的附录,Skills 让 Claude 只在需要时加载信息:

Claude推出Skills功能及AgentSkills开发指南-7

拥有文件系统和代码执行工具的 Agent 在处理特定任务时不需要将技能的全部内容读入其上下文窗口。

也就是说,可以捆绑到技能中的 上下文量实际上是无限的 。

Skills 与上下文窗口

下图展示了当用户消息触发技能时,上下文窗口是如何变化的:

Claude推出Skills功能及AgentSkills开发指南-8

操作序列如下:开始时,上下文窗口包含核心系统提示和每个已安装技能的元数据,以及用户的初始消息;Claude 通过调用 Bash 工具读取 pdf/SKILL.md 的内容来触发 PDF 技能;Claude 选择读取与技能捆绑的 forms.md 文件;最后,Claude 在从 PDF 技能加载了相关指令后继续执行用户的任务。

Skills 与代码执行

Skills 还可以包含供 Claude 自行决定执行的代码作为工具。

大型语言模型在许多任务上表现出色,但某些操作更适合传统的代码执行。例如,通过 token 生成对列表进行排序比简单运行排序算法要昂贵得多。

除了效率问题,许多应用程序需要只有代码才能提供的确定性可靠性。

Claude推出Skills功能及AgentSkills开发指南-9

在该例子中,PDF 技能包括一个预编写的 Python 脚本,用于读取 PDF 并提取所有表单字段。

Claude 可以运行此脚本,而无需将脚本或 PDF 加载到上下文中。由于代码是确定性的,这个工作流程是一致且可重复的。

开发和评估 Skills

Anthropic 提供了一些开发和测试 Skills 的实用指南:

从评估开始

通过在代表性任务上运行 Agent 并观察它们在哪里遇到困难或需要额外上下文,识别 Agent 能力中的具体差距。然后逐步构建技能来解决这些不足。

为规模而结构化

当 SKILL.md 文件变得难以管理时,将其内容拆分为单独的文件并引用它们。如果某些上下文是互斥的或很少一起使用,保持路径分离将减少 token 使用。代码可以同时作为可执行工具和文档。应该清楚 Claude 是应该直接运行脚本还是将它们作为参考读入上下文。

从 Claude 的角度思考

监控 Claude 在实际场景中如何使用你的技能,并根据观察进行迭代:注意意外的轨迹或对某些上下文的过度依赖。特别注意你的技能的 name 和 description 。Claude 将在决定是否触发技能以响应其当前任务时使用这些。

与 Claude 一起迭代

当你与 Claude 一起工作时,要求 Claude 将其成功的方法和常见错误捕获到技能中的可重用上下文和代码中。如果它在使用技能完成任务时偏离轨道,要求它自我反思出了什么问题。这个过程将帮助你发现 Claude 实际需要什么上下文,而不是试图提前预测。

安全考虑

Skills 通过指令和代码为 Claude 提供新能力。

虽然这使它们强大,但也意味着恶意技能可能在使用它们的环境中引入漏洞,或指示 Claude 泄露数据并采取意外行动。

Anthropic 建议只从可信来源安装技能。当从不太可信的来源安装技能时,使用前要彻底审核。首先阅读技能中捆绑文件的内容以了解它的功能,特别注意代码依赖项和捆绑的资源,如图像或脚本。

同样,注意技能中指示 Claude 连接到潜在不受信任的外部网络源的指令或代码。

全平台支持

Claude 应用

Skills 现在对 Pro、Max、Team 和 Enterprise 用户可用。

Anthropic 为常见任务提供技能,如文档创建、可以自定义的示例,以及创建自己的自定义技能的能力。

Claude推出Skills功能及AgentSkills开发指南-10

Claude 根据你的任务自动调用相关技能,而无需手动选择。你甚至可以在 Claude 工作时看到它的思维链中的技能。

要创建技能,则很简单:

Anthropic 提供的「 skill-creator 」技能可以进行交互式的创建指导:Claude 会询问你的工作流程,生成文件夹结构,格式化 SKILL.md 文件,并捆绑你需要的资源。

无需手动编辑文件,动嘴就可。

Claude 开发者平台(API)

Agent Skills 现在可以添加到 Messages API 请求中,新的 /v1/skills 端点让开发者对自定义技能版本控制和管理有程序化控制。

Skills 需要 Code Execution Tool beta,它提供了运行所需的安全环境。

使用 Anthropic 创建的技能让 Claude 读取和生成带有公式的专业 Excel 电子表格、PowerPoint 演示文稿、Word 文档和可填写的 PDF。

开发者可以创建自定义 Skills 来扩展 Claude 的能力以满足他们的特定用例。

Claude Code

当然,还有 Claude Code :

Skills 可以让 你用团队的专业知识和工作流程来扩展 Claude Code。

通过 anthropics/skills 市场的插件安装技能,Claude 在相关时自动加载它们。通过版本控制与你的团队共享技能。你也可以通过将技能添加到 ~/.claude/skills 来手动安装技能。

Claude Agent SDK 为构建自定义 Agent 提供相同的 Agent Skills 支持。

用户反响

Satvik(@satvikmaker)评论:

使用文件夹和文件构建专门的 Agent 是一个游戏规则改变者。继续加油 Anthropic 团队。🔥👑

Carlos Lebron(@carlosml)笑称:

Agent Skills 听起来很酷。终于有办法让 Claude 帮我洗衣服了

Vijay Krishna S(@vjk_2k5)指出:

Claude 刚刚在暴力训练方法上加倍下注,并在编码方面击败了其他所有 AI 公司,这太疯狂了。

企业应用前景

多家企业已经开始探索 Skills 的应用潜力:

Box

Skills 教会 Claude 如何处理 Box 内容。用户可以将存储的文件转换为遵循其组织标准的 PowerPoint 演示文稿、Excel 电子表格和 Word 文档,从而节省数小时的工作。

Notion

有了 Skills,Claude 与 Notion 无缝协作,让用户从问题到行动更快。在复杂任务上减少提示词的纠结,获得更可预测的结果。

Canva

利用 Skills 来定制 Agent 并扩展它们的能力。这解锁了将 Canva 更深入地带入 Agent 工作流程的新方法,帮助团队捕获他们独特的上下文并轻松创建令人惊叹的高质量设计。

Rakuten

Skills 简化了我们的管理会计和财务工作流程。Claude 处理多个电子表格,捕获关键异常,并使用我们的程序生成报告。曾经需要一天的工作,我们现在可以在一小时内完成。

未来

Anthropic 正在努力实现简化的技能创建工作流程和企业范围的部署能力,使组织更容易在团队间分发技能。

在未来几周,他们将继续添加支持创建、编辑、发现、共享和使用 Skills 的完整生命周期的功能。他们特别期待 Skills 帮助组织和个人与 Claude 共享他们的上下文和工作流程的机会。

他们还将探索 Skills 如何通过教授 Agent 涉及外部工具和软件的更复杂工作流程来补充 Model Context Protocol(MCP)服务器。

而展望更远的未来,Anthropic 甚至希望让 Agent 能够自主创建、编辑和评估 Skills,让它们将自己的行为模式编码为可重用的能力。

Skills 是一个简单的概念,具有相应简单的格式。而这种简单性,则使组织、开发者和最终用户更容易构建定制的 Agent 并赋予它们新能力。

[1]

Anthropic 工程博客: https://www.anthropic.com/engineering/equipping-agents-for-the-real-world-with-agent-skills

[2]

版权声明:
作者:shadowrocket
链接:https://www.shadowrocket9.top/69.html
来源:Shadowrocket官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>