FlowKit

📝 博客深度解读: FlowKit: AI 原生工作流编排工具集 —— 设计动机、核心架构、设计决策与踩坑经验详解

AI 原生工作流编排工具集 —— 从任务分析到验证交付的结构化管道。

English | 中文

Pipeline 架构总览

                              ┌──────────────────────────────────────────────────┐
                              │                  FlowKit 管道                    │
                              └──────────────────────────────────────────────────┘
         ┌───────────┐   ┌───────────┐   ┌───────────┐   ┌───────────┐
  Input──▶│  Stage 0  │──▶│  Stage 1  │──▶│  Stage 2  │──▶│  Stage 3  │──┐
         │ 前置检查  │   │ Prompt优化│   │ 深度思考  │   │ 确定性规划│  │
         └───────────┘   └───────────┘   └───────────┘   └───────────┘  │
                                                                            │
         ┌──────────────────────────────────────────────────────────────────┘
         │
         ▼
    ┌───────────┐   ┌───────────┐   ┌───────────┐   ┌───────────┐
    │ Stage 3.5 │──▶│ Stage 3.6 │──▶│  Stage 4  │──▶│  Stage 5  │──┐
    │ Plan Review│  │ 多角色面板│   │ 多Agent执行│  │  完成验证 │  │
    └───────────┘   └───────────┘   └───────────┘   └───────────┘  │
                                                                       │
         ┌──────────────────────────────────────────────────────────────┘
         ▼
    ┌─────────────────┐
    │  Stage 5.5/5.7  │  ── 未达标时自动迭代，Ralph Loop 强制持续
    │  自主迭代引擎   │
    └─────────────────┘

为什么造这个轮子

使用 AI 编程助手（Claude Code、Cursor 等）的过程中发现一个核心问题：Agent 能力很强但缺乏纪律性。它们跳过验证、忽略边界情况、用"应该可以"来宣布完成。FlowKit 把软件工程的严谨性注入 AI Agent 工作流 —— 让"感觉驱动的编码"变成可重复的工程流程。

核心模块

模块	定位	一句话亮点
flow	轻量编排引擎	按需启用 —— 通过参数控制管道阶段
flow-deep	全量深度引擎	强制全开 —— 所有关卡不可跳过
multi-agent	多 Agent 协作	tmux 分屏并行 + 阶段间复用
prompt	Prompt 评分	乔哈里视窗 + 3S 原则量化评估

设计亮点

1. Iron Laws —— 不可协商的执行铁律

四条规则，每条配备合理化辩解对照表，防止 LLM 自我辩解跳过：

  IL-1 · TDD                  IL-2 · Verify
  ┌────────────────┐          ┌────────────────┐
  │ No prod code   │          │ No "done"      │
  │ without failed │          │ without fresh  │
  │ test           │          │ evidence       │
  └───────┬────────┘          └───────┬────────┘
          │                           │
          ▼                           ▼
   "too simple"               "should work"
          │                           │
          └──────────┬────────────────┘
                     ▼
          ┌─────────────────────┐
          │ Rationalization Tbl │
          │ excuse -> rebuttal  │
          └─────────────────────┘

  IL-3 · Debug                 IL-4 · Review
  ┌────────────────┐          ┌────────────────┐
  │ No code change │          │ Review is      │
  │ without root   │          │ read-only      │
  │ cause          │          │ never modify   │
  └────────────────┘          └────────────────┘

IL-1: 无失败测试不写生产代码 · IL-2: 无新鲜证据不宣布完成 · IL-3: 无根因确认不改代码 · IL-4: 审查只读永不修改

2. Auto-Decide Layer —— 减少 80% 人工评审

多角色面板评审（Stage 3.6）中，6 条原则自动分类发现项：

  发现项输入
      │
      ▼
  ┌──────────────────────┐
  │   Auto-Decide Layer  │
  ├──────────────────────┤
  │                      │
  │  P1 行业标准 ────────┼── 违反 → 自动修复 (AUTO_FIX)
  │  P2 风险阈值 ────────┼── 高风险 → 修复 / 低风险 → 通过
  │  P3 一致性   ────────┼── 与已有一致 → 自动通过 (AUTO_APPROVE)
  │  P4 YAGNI    ────────┼── 过度设计 → 上浮给用户 ⚖️
  │  P5 安全优先 ────────┼── 安全相关 → 自动修复
  │  P6 不可逆性 ────────┼── 不可逆 → 上浮给用户 ⚖️
  │                      │
  └──────┬───────┬───────┘
         │       │
         ▼       ▼
   ┌──────────┐  ┌──────────────────┐
   │ 80% 自动 │  │ 20% Taste       │
   │ 处理完毕 │  │ Decision 上浮   │
   │ (静默)   │  │ 给用户决策      │
   └──────────┘  │ (通常 < 5 条)   │
                 └──────────────────┘

只有 Taste Decision（品味决策）需要人工 —— 通常 < 5 条，而非 20+ 条。

3. STATE.md —— 跨会话恢复

管道内置崩溃恢复机制：

  会话在 Stage 4 Phase 2 中断 💥
          │
          ▼
  ┌─────────────────────────┐
  │    .plan/STATE.md        │
  │                          │
  │  current_stage: 4        │
  │  current_phase: 2        │
  │  next_action: "Stage 5"  │
  │  progress: 65%           │
  └──────────┬──────────────┘
             │
             ▼
  新会话读取 STATE.md
          │
          ▼
  "上次停在 Stage 4 Phase 2
   —— 恢复还是重新开始？"
          │
          ▼
  从断点精确恢复 ──▶ 继续执行

GSD、GStack 等社区框架均无此能力。

4. Prompt 量化评分

基于乔哈里视窗理论 + 3S 原则：

                AI 知道           AI 不知道
            ┌──────────────┬──────────────┐
  人知道    │ Q1 公共知识   │ Q4 独有知识 ⚠│
            │ 直接描述即可  │ 必须喂模式    │
            ├──────────────┼──────────────┤
  人不知道  │ Q2 AI 专业   │ Q3 探索创新   │
            │ 信任 AI 即可  │ 协同探索      │
            └──────────────┴──────────────┘

  Q4 未使用喂模式 → 评分 ≤ 2/10 (Critical)
  Q4 使用喂模式   → 评分 7.0-8.5/10

5. Fallback 协议 —— 遇错先问 Plan

执行中遇到意外时，第一反应不是"怎么修"，而是"Plan 哪里假设错了"：

  执行遇到异常
      │
      ├─ 小偏差 ────────────▶ 直接修复 ──▶ 继续
      │
      ├─ Plan 假设有误 ─────▶ Plan Fallback
      │                       │
      │                  ┌────┴────┐
      │                  ▼         │
      │              暂停执行      │
      │              记录偏差      │
      │              更新 Plan     │
      │              用户确认 ─────┘
      │                  │
      │                  ▼
      │              继续执行
      │
      └─ 同一 Phase 失败 2 次
              │
              ▼
         退回 Stage 2 重新分析

Flow vs Flow-Deep

维度	`/flow`	`/flow-deep`
前置检查	—	强制开启
深度思考	可选 (`--think`)	强制（ST + Mermaid + 三角色讨论）
Plan Mode	默认开启，可关闭	不可关闭
Plan Review	可选	强制
多角色面板	—	默认 3-5 角色
TDD 注入	可选	自动注入
完成验证	可跳过	不可跳过
Ralph Loop	手动触发	迭代用完自动触发

快速上手

本工具集为 Claude Code CLI 设计。

一行安装（推荐）

通过 skills.sh（Vercel Labs 的 Agent Skills 包管理器）一行安装全部模块：

npx skills add FrizzleFur/flowkit -a claude-code

只安装单个模块：

npx skills add https://github.com/FrizzleFur/flowkit/tree/main/skills/flow

手动安装（无 Node 环境备选）

# 复制所需模块到 Claude Code skills 目录
cp -r skills/flow ~/.claude/skills/
cp -r skills/flow-deep ~/.claude/skills/
cp -r skills/multi-agent ~/.claude/skills/
cp -r skills/prompt ~/.claude/skills/

在 Claude Code 中调用：

/flow 重构认证模块
/flow-deep 重新设计支付系统，支持多币种
/prompt 评估这个提示词："写一个排序算法"

设计哲学

来源	管什么	我们吸收了什么
GStack	决策流程	Auto-Decide Layer (P1-P6 + Taste Decision)
Superpowers	执行纪律	Iron Laws + Rationalization Table
GSD	上下文质量	STATE.md 跨会话恢复

原创贡献（社区框架中均未出现）：

STATE.md 崩溃恢复机制
Auto-Decide Layer 六原则自动决策系统
Ralph Loop 集成（Stop Hook + auto-iterate 双层迭代）
乔哈里视窗 Prompt 量化评分

License

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
skills		skills
.gitignore		.gitignore
README.md		README.md
README_EN.md		README_EN.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

FlowKit

Pipeline 架构总览

为什么造这个轮子

核心模块

设计亮点

1. Iron Laws —— 不可协商的执行铁律

2. Auto-Decide Layer —— 减少 80% 人工评审

3. STATE.md —— 跨会话恢复

4. Prompt 量化评分

5. Fallback 协议 —— 遇错先问 Plan

Flow vs Flow-Deep

快速上手

一行安装（推荐）

手动安装（无 Node 环境备选）

设计哲学

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Folders and files

Latest commit

History

Repository files navigation

FlowKit

Pipeline 架构总览

为什么造这个轮子

核心模块

设计亮点

1. Iron Laws —— 不可协商的执行铁律

2. Auto-Decide Layer —— 减少 80% 人工评审

3. STATE.md —— 跨会话恢复

4. Prompt 量化评分

5. Fallback 协议 —— 遇错先问 Plan

Flow vs Flow-Deep

快速上手

一行安装（推荐）

手动安装（无 Node 环境备选）

设计哲学

License

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Packages