Claude Code开发者大会系列8：从脚本到智能体——独立开发者的“AI原生”工作流转型

摘要：旧金山ClaudeCode Extended专场聚焦AI工作流转型，提出从"脚本工具"到"Agentic工作流"的三阶段演进。核心方案包括Routines自动化引擎、多智能体代码审查和AgentView管理面板，通过"频率×复杂度"打分法筛选高价值自动化任务。

Rubin智造社

281人浏览 · 2026-05-21 10:36:56

Rubin智造社 · 2026-05-21 10:36:56 发布

编者按：旧金山Extended专场是Anthropic专为个人开发者与小型团队“加场”的深度日，议程聚焦Claude Code实战应用与Agentic工作流的落地。本文将大会工作坊核心内容与实操指南系统化，带你完成从“单人写脚本”到“AI舰队自动化运行”的关键跨越。

在San Francisco的Code with Claude Extended专场上，一位参会开发者记录了自己最真实的体验。他在dev.to上写道：“在任何工作坊开始之前，Boris Cherny先做了一个演讲。第一句击中我的话是——领域专家现在可以为自己构建工具了。迭代、倾听、交付。Claude Code于2025年2月由一个小团队推出，而现在我们坐在这里，亲眼见证。”

这句话，精准概括了Extended专场的核心理念：AI编码的门槛正在消失，真正稀缺的将不再是敲代码的速度，而是设计AI工作流的能力。

一、工作流转型的三个阶段

第一阶段：脚本工具时代——AI是一个听话的“函数调用器”

在这个阶段，开发者使用Claude Code执行一对一指令：生成单一函数、修复一个Bug、写一段测试代码。核心特征是单次请求、单次输出、低频使用。AI的角色相当于一个随时待命的“代码片段生成器”——你说一句，它动一下。

这个阶段的上限很低。即便每次输出质量完美，瓶颈依然是人——人需要去想“接下来让AI做什么”，人需要逐一验证每个输出，人需要手动串联多个AI调用才能完成更复杂的任务。

第二阶段：半自动工具时代——提示词链的“手工作坊”

当开发者发现单个AI调用不够用时，自然就会开始撰写复杂的提示词链。一个提示的输出，经过手动整理和裁剪后，作为下一个提示的输入。于是形成了“半自动工具”——人依然是整个流程的调度中枢，但AI已经能在局部环节持续产出。

这个阶段的瓶颈同样明显：人工编写和运行脚本耗时较多，而且提示词链的质量高度依赖操作者的经验。同样的任务，有经验的开发者可能十分钟跑完一个链，新手可能要两小时，而且结果还不稳定。

第三阶段：Agentic工作流时代——从“写脚本”到“设计工作流”

在Extended专场的工作坊中，Anthropic团队反复强调一个核心理念：开发者不再“写脚本”，而是“设计工作流” 。这不是措辞的变化，而是范式的根本跃迁。

两者的本质区别在于：写脚本的逻辑是人告诉AI“每一步做什么、怎么做、何时做”；设计工作流的逻辑是人为AI设定目标、定义边界条件和成功标准，然后AI自主规划执行路径并持续运行。

在这个阶段，三大能力支撑起Agentic工作流的骨架：

Routines：将定时任务或事件触发自动化任务封装为云端持久化配置。你不需要写cron表达式和复杂的CI配置，只需要用自然语言描述任务目标和触发条件，Routine就会在Anthropic云端独立运行——即使你合上电脑下班，任务也不会中断。Boris Cherny亲自部署了几十个Loop（Routines的前身），每天帮他自动修复CI冲突、监控流水线健康、从Twitter抓取用户反馈。
Multi-agent Orchestration：让多个AI同时处理不同分片任务，最终汇总结果。一个主导Agent拆解任务，分派给配备专属模型、提示词和工具的专项子Agent在共享文件系统上并行运作。Netflix的实践已证明，这种“兵团作战”模式在事件调查等数据源分散的场景中能将故障排查时间压缩到分钟级。
Agent View：将所有AI会话集中在单一视图管理。2026年5月12日，Claude Code正式推出Agent View功能——用户通过运行claude agents命令或在会话中按左方向键即可进入总控面板，所有后台AI会话按状态分组展示（“等待输入”、“运行中”、“已完成”），支持在不离开面板的情况下预览结果、直接回复、或一键进入完整会话。与此同时，团队新增了/bg与claude --bg [task]命令，允许将任意会话直接转入后台持续运行，关闭面板不影响任务执行。

三者叠加，AI不再是一次性的工具，而成为持续运转的工作流引擎。

二、识别自动化候选任务——小型团队的“频率×复杂度”打分法

Extended专场的一个核心挑战是：不是所有任务都值得自动化。对于资源有限的个人开发者和小型团队，选择错误的自动化对象比不自动化更危险——投入了配置时间，却收不到实际效率提升。

工作坊推荐了“频率×复杂度”打分法，用两个维度筛选最优自动化候选任务：

维度	低（1分）	中（3分）	高（5分）
频率	每月1-2次	每周1-2次	每天1次以上
复杂度	单步操作，无需判断	涉及2-3个系统，需简单判断	涉及多个数据源，需综合决策

得分公式：频率 × 复杂度。得分≥15分的任务是最高优先级的自动化候选。

根据真实团队实践，以下几个场景得分最高、收益最明显：

每日常规代码同步和依赖审计（频率5×复杂度3=15分）：每天自动检查依赖是否有已知安全漏洞，生成审计报告和升级建议。
夜间自动报告生成与测试反馈分析（频率5×复杂度4=20分）：凌晨运行全量回归测试，分析失败根因，自动打开附带诊断信息的Issue。
PR自动标签分类与初审（频率5×复杂度3=15分）：监听PR创建事件，自动根据变更范围打标签、分配Reviewer、跑安全审查。

与此对比，一些“看起来很自动化”但实际不适合优先投入的任务：每月一次的部署（频率太低）、需要大量主观判断的设计评审（AI难以胜任）、涉及未文档化业务规则的逻辑变更（错误成本太高）。

三、小型团队Claude Code工具栈速查

Extended专场为个人开发者和小型团队梳理了一套完整的工具组合。以下是四个核心工具的定位与实战用法：

Routines：个人自动化引擎

定位：执行每日重复任务的云端引擎，支持定时（Cron）、GitHub Webhook事件、API调用三种触发方式。

核心配置：访问claude.ai/code/routines创建。提示词是Routine最关键的部分——因为Routine在无人干预下运行，提示词必须像Checklist一样具体，不能模糊不清。

实战配置示例（每日依赖安全审计）：

名称：Daily Dependency Audit
触发方式：Schedule（每天凌晨2:00）
关联仓库：[your-project-repo]
Prompt：
1. 扫描package.json中所有依赖项的最新版本和安全公告
2. 对每个有已知漏洞的依赖，评估升级路径和兼容性风险
3. 如果有需要升级的依赖，创建一个分支并提交升级PR
4. 在PR描述中附上完整的漏洞详情和升级建议
5. 通过Slack Connector向#dev频道发送审计摘要

用量与成本：Pro用户每日5条、Max每日15条、Team/Enterprise每日25条。注意一个关键机制：Routine在云端4核CPU、16GB内存的独立沙盒中运行，不占用本地资源，也不受Token用量限制，但你仍然按实际使用的Token付费。超出日常配额后，按用量计费。GitHub触发有小时级频控，超出窗口的事件会被丢弃，活跃仓库建议提前设好事件过滤器以最大化配额利用率。

Code Review（多智能体代码审查）

定位：用2-3个专项AI同时从安全、性能、规范三个维度审阅PR，取代单一人类Reviewer的有限视角。

工作机制：通过Routines调度多个专项Agent并行审查。典型配置包括：安全Agent（检查SQL注入、XSS、密钥泄露）、性能Agent（检查N+1查询、不必要的循环、大对象分配）、规范Agent（检查命名约定、代码风格、架构分层）。

工作坊建议：为每个审查维度预设经过版本化的提示词模板。所有AI审查结果必须汇总到人类Reviewer做最终决策——AI负责“发现问题”，人负责“判断是否真的是问题以及如何处理”。AI生成的PR一律需要人工审批，严禁设置自动合并。

Actions（自动修复）

定位：当CI报错或收到Review评论后，自动分析、修复、推送提交——仅适用于已被测试验证的代码区域。

工作机制：2026年3月正式上线的“云端自动修复”功能。PR创建后，Claude Code通过GitHub App订阅CI check事件和review comment事件。一旦检测到CI报错，Claude会自动拉取错误日志、分析根因、生成修复代码、推送到PR分支。

安全使用原则：

Actions仅在CI全部通过的前提下才能应用修复——测试覆盖率低于60%的模块中禁止启用。
每次Action应用的修复必须生成可审计日志。
高危PR（涉及认证、支付、数据处理）必须人工Review，不得自动合并。

Anthropic CC工程师Lydia Hallie在工作坊中半开玩笑地说：“开启自动修复，去摸鱼吧！”但这有一个严肃的前提——你必须先确保CI测试覆盖了关键业务路径，否则AI修复了表面错误，可能埋下了更深的逻辑隐患。

Agent View（多会话并行管理）

定位：同时监控和管理多个正在运行的AI会话，是独立开发者的“指挥中心”。2026年5月12日作为Research Preview正式上线。

核心交互：运行claude agents命令进入总控面板。所有后台会话按状态分组——“Needs input”（等待用户决策）和“Ready for review”置顶，其次是“Working”（运行中）和“Completed”（已完成）。每行展示一行AI当前行为的摘要，每15秒刷新一次。选中行按空格键可预览最近输出并直接内联回复，按回车键进入完整会话。

后台托管机制：每个后台会话是独立的Claude Code进程，挂载在per-user supervisor进程下，而非终端进程。关闭终端、重启Agent View、自动更新都不会中断任务。为防止并行会话互相干扰，需要写文件的会话会被自动移入.claude/worktrees/下的隔离git worktree。

注意：每个后台会话独立消耗订阅用量。并行运行10个Agent会以大约10倍于单个会话的速度消耗速率限制，建议为每个Agent设定明确的超时时间和最大Token用量，防止意外大量消耗。

四、安全基线与最佳实践

独立开发者和小型团队的一个常见误区是：“我的项目没人盯上，所以安全不需要太认真” 。但在AI工具深度介入代码库的背景下，安全风险不再是“外部攻击”的问题，而是“AI无意中做错事”的问题。

1. settings.json拒绝规则

settings.json是Claude Code的安全配置中枢。使用其中的deny规则屏蔽AI对敏感资源的访问：

{
  "rules": {
    "deny": [
      "读取 .env 文件",
      "读取 .env.local",
      "读取 ~/.ssh/ 目录下的任何文件",
      "读取 .git/config",
      "读取包含 'secret' 或 'token' 的文件"
    ]
  }
}

Checkmarx在2026年2月的安全报告中披露了两个与Claude Code配置信任相关的CVE（CVE-2025-59536和CVE-2026-21852），核心风险在于Claude Code会加载仓库中的.claude/settings.json文件——恶意代码可以嵌入hooks配置中，在会话启动时被自动执行。因此，当你clone一个不熟悉的仓库并打开Claude Code时，请务必检查.claude/settings.json的内容，确认里面的hooks指令是安全的。

2. 按任务分配权限

阶段	权限级别	说明
本地开发	读写当前仓库	不授予生产环境访问权限
CI代码生成	仓库写入权限	使用GitHub App Token，限定特定仓库
CI测试运行	只读CI Token	禁止写入任何仓库
部署/发布	受限于分支+环境保护规则	需要额外人工审批

核心理念：不要给Claude Code一个“万能账号”。AI可能在某些边界场景下做出非预期行为——隔离权限可以将任何事故的破坏半径降到最低。

3. 审计日志定期回顾

工作坊建议设置两个日历提醒：

每周回顾：检查所有AI生成的PR的合并率和Review中发现的问题类型，建立团队的“AI常见错误清单”。
每月回顾：检查Agent的历史操作记录和代码生成模式，发现潜在的“规范漂移”——AI是否在某个时间点之后开始系统性地偏离CLAUDE.md中定义的编码标准。

4. 限制自动合并范围

所有AI生成的PR必须经人工Review和CI全量测试通过后才合并。AI的“自信度”和“正确率”之间存在危险的脱节——它可能以百分百的肯定口吻写出一段完全错误的业务逻辑。对于涉及认证、支付、数据处理的代码变更，加倍警惕。建议专门建立一份AI代码审查Checklist：是否有未处理的异常路径？是否有不正确的类型假设？是否遗漏了边缘情况？

五、搭建你的第一条Agentic工作流

Extended专场的工作坊有一个鲜明的特点——不光是听讲，更强调动手。一位参会者回忆道：“讲师做了一个简短概述后，直接说‘clone repo然后开始’。周围所有人都开始敲键盘。”以下四步就是从无数参会者的实战经验中提炼出的标准路径，你可以在30分钟内完成第一条Agentic工作流的搭建。

第一步：创建项目的“DNA”——CLAUDE.md

在项目根目录创建CLAUDE.md文件，这是Claude Code理解你的项目的唯一入口。你必须告诉它所有关键信息：

# 项目概述
这是一个[项目类型]，使用[技术栈]构建。
主要功能是[核心功能描述]。

# 技术栈约束
- 前端：React 18 + TypeScript
- 后端：Node.js 20 + Express
- 数据库：PostgreSQL 15
- 测试框架：Jest + React Testing Library

# 编码规范
- 使用函数式组件和Hooks，不使用Class组件
- API路由统一放在 /api/v1/ 下
- 所有函数必须有JSDoc注释
- 错误处理：使用try-catch包装所有异步操作

# 架构约定
- 数据库操作统一通过 /src/db/ 下的模块封装
- 业务逻辑放在 /src/services/ 下
- 组件分为 /src/components/ui/（通用UI）和 /src/components/features/（业务组件）

两个注意：第一，CLAUDE.md必须走版本化和同行评审流程——不规范的CLAUDE.md会“污染”所有下游AI产出。第二，对于多服务项目，建议根目录有一个总体CLAUDE.md，每个子服务下再有一份独立的CLAUDE.md。

第二步：选择一个小高频任务，创建第一条Routine

从得分最高的自动化候选任务入手。以“每日依赖安全审计”为例：

访问 claude.ai/code/routines
点击“New Routine”
配置名称、提示词（参考第三部分的模板）、关联仓库
触发方式选“Schedule”，设为每天凌晨2:00
关联Slack Connector（可选），用于发送通知
保存并启用

第二天早上，你会在Slack收到第一条审计报告，并看到Claude自动创建的升级PR（如果有需要更新的依赖）。

第三步：配置Code Review流程模板

在仓库中创建.claude/review-prompts/目录，为三个审查维度准备提示词：

security-review.md：

审查以下PR变更的安全性：
1. 是否有未验证的用户输入？
2. 是否有SQL注入或XSS风险？
3. 是否有密钥或敏感信息泄露？
4. 权限校验是否完整？

performance-review.md：

审查以下PR变更的性能影响：
1. 是否有N+1查询？
2. 是否有不必要的循环或大对象分配？
3. 是否有缓存未命中风险？
4. 是否有阻塞主线程的操作？

style-review.md：

审查以下PR变更的代码规范：
1. 命名是否符合项目约定？
2. 文件组织是否遵循架构分层？
3. JSDoc注释是否完整？
4. 是否有未使用的导入或变量？

创建Routine时，选择“GitHub event”触发类型，过滤器设为“PR opened”，将这些提示词作为三个独立的子任务配置。完成PR创建后，三个Agent将并行审查，汇总结果到PR评论区。

第四步：在Agent View中监控你的AI舰队

完成上述三步后，你会拥有至少一条Routine在云端运行。打开Claude Code，输入：

claude agents

你会看到一个统一的总控面板，展示所有后台会话的状态。不再需要在多个Terminal窗口间反复切换。每个Agent的状态一目了然——哪些在运行、哪些等待你的决策、哪些已完成。

当你需要启动一个新任务而不想让它占据前台终端时：

claude --bg "分析最近一周的Issue，按优先级分类并生成周报"

任务会在后台自动运行，完成后出现在Agent View的“Completed”列表中。你可以随时预览结果、选择合并或存档。

结语：未来衡量生产力的不再是代码行数

从脚本到智能体的三步跃迁，本质上是开发者角色的重新定位：从“代码生产者”到“工作流设计者”。

在Extended专场结束后的采访中，Boris Cherny再次强调了一个被低估的观点：“工具对所有人开放，但真正产生差距的是你如何组织你的流程。”完成上述四步——CLAUDE.md、第一条Routine、Code Review模板、Agent View——你就实现了从“单人写脚本”到“AI舰队自动化运行”的关键跨越。

当你的代码库中99%的PR都标注着claude/分支前缀，当你早上打开Agent View看到的不是待办列表而是一排绿色的“Completed”，当你在手机上轻点“自动修复”就去喝咖啡——你就已经进入了一个全新的开发范式。在这个范式里，你的产出不再与代码行数、PR数量、在线时长挂钩，而与你设计的AI工作流有多高效挂钩。

未来衡量开发者生产力的不是代码行数和PR数量，而是你设计的AI工作流有多高效。

现在——去claude.ai/code/routines创建你的第一条Routine。

#Claude Code #开发者大会 #Extended专场 #独立开发者 #Agentic工作流 #Routines #Code Review #Agent View #工作流转型 #AI原生开发 #安全基线 #小型团队 #实操指南 #CLAUDE.md #Actions