Lobster

Lobster 是一个工作流 shell,让 OpenClaw 可以将多步骤工具序列作为一次确定性操作运行,并内置显式审批检查点。

切入点

你的助手可以自己构建管理自身的工具。跟它说你想要一个工作流,30 分钟后你就有了一个 CLI 加上可以一次调用完成的管线。Lobster 就是那块缺失的拼图:确定性管线、显式审批、可恢复状态。

为什么要用它

现在,复杂的工作流需要大量来回的工具调用。每次调用都消耗 token,而且 LLM 必须编排每一步。Lobster 把这个编排逻辑移到了类型化运行时中:

  • 一次调用搞定多步:OpenClaw 发起一次 Lobster 工具调用,拿到结构化结果。
  • 审批内置:有副作用的操作(发邮件、发评论)会暂停工作流,直到被明确批准。
  • 可恢复:暂停的工作流返回一个 token;批准后继续执行,不需要重跑。

为什么用 DSL 而不是普通程序?

Lobster 故意做得很小。目标不是”又一门新语言”,而是一个可预测、对 AI 友好的管线规范,自带一等公民级别的审批和恢复 token。

  • 审批/恢复是内置的:普通程序可以提示人类,但不能在没有你自己发明那套运行时的前提下做到”暂停并用持久化 token 恢复”。
  • 确定性 + 可审计:管线就是数据,所以很容易记录、对比、回放和审查。
  • AI 的受限表面:小语法 + JSON 管道减少了”发挥创意”的代码路径,让校验变得可行。
  • 安全策略内置:超时、输出上限、沙箱检查和白名单由运行时强制执行,而不是每个脚本各自为政。
  • 依然可编程:每个步骤可以调用任何 CLI 或脚本。想用 JS/TS,就从代码生成 .lobster 文件。

工作原理

OpenClaw 在工具模式下启动本地 lobster CLI,并从 stdout 解析 JSON 信封。 如果管线因审批暂停,工具会返回一个 resumeToken,让你后续可以继续。

模式:小 CLI + JSON 管道 + 审批

构建输出 JSON 的小命令,然后把它们串成一次 Lobster 调用。(下面的命令名只是示例——换成你自己的就行。)

inbox list --json
inbox categorize --json
inbox apply --json
{
  "action": "run",
  "pipeline": "exec --json --shell 'inbox list --json' | exec --stdin json --shell 'inbox categorize --json' | exec --stdin json --shell 'inbox apply --json' | approve --preview-from-stdin --limit 5 --prompt 'Apply changes?'",
  "timeoutMs": 30000
}

如果管线请求审批,用 token 恢复:

{
  "action": "resume",
  "token": "<resumeToken>",
  "approve": true
}

AI 触发工作流;Lobster 执行步骤。审批节点让副作用变得显式且可审计。

示例:将输入项映射为工具调用:

gog.gmail.search --query 'newer_than:1d' \
  | openclaw.invoke --tool message --action send --each --item-key message --args-json '{"provider":"telegram","to":"..."}'

JSON-only LLM 步骤(llm-task)

如果工作流需要一个结构化 LLM 步骤,启用可选的 llm-task 插件工具并从 Lobster 中调用它。这样工作流保持确定性,同时仍可以用模型做分类/摘要/起草。

启用工具:

{
  "plugins": {
    "entries": {
      "llm-task": { "enabled": true }
    }
  },
  "agents": {
    "list": [
      {
        "id": "main",
        "tools": { "allow": ["llm-task"] }
      }
    ]
  }
}

在管线中使用:

openclaw.invoke --tool llm-task --action json --args-json '{
  "prompt": "Given the input email, return intent and draft.",
  "thinking": "low",
  "input": { "subject": "Hello", "body": "Can you help?" },
  "schema": {
    "type": "object",
    "properties": {
      "intent": { "type": "string" },
      "draft": { "type": "string" }
    },
    "required": ["intent", "draft"],
    "additionalProperties": false
  }
}'

详情和配置选项参见 LLM Task

工作流文件(.lobster)

Lobster 可以运行包含 nameargsstepsenvconditionapproval 字段的 YAML/JSON 工作流文件。在 OpenClaw 工具调用中,将 pipeline 设为文件路径即可。

name: inbox-triage
args:
  tag:
    default: "family"
steps:
  - id: collect
    command: inbox list --json
  - id: categorize
    command: inbox categorize --json
    stdin: $collect.stdout
  - id: approve
    command: inbox apply --approve
    stdin: $categorize.stdout
    approval: required
  - id: execute
    command: inbox apply --execute
    stdin: $categorize.stdout
    condition: $approve.approved

说明:

  • stdin: $step.stdoutstdin: $step.json 传递前一步骤的输出。
  • condition(或 when)可以根据 $step.approved 来控制步骤执行。

安装 Lobster

在运行 OpenClaw Gateway 的同一台主机上安装 Lobster CLI(参见 Lobster 仓库),并确保 lobsterPATH 上。

启用工具

Lobster 是一个可选插件工具(默认不启用)。

推荐方式(追加式,安全):

{
  "tools": {
    "alsoAllow": ["lobster"]
  }
}

或按 Agent 配置:

{
  "agents": {
    "list": [
      {
        "id": "main",
        "tools": {
          "alsoAllow": ["lobster"]
        }
      }
    ]
  }
}

除非你打算以限制性白名单模式运行,否则避免使用 tools.allow: ["lobster"]

注意:白名单对可选插件是 opt-in 的。如果你的白名单只列了插件工具(比如 lobster),OpenClaw 会保持核心工具可用。要限制核心工具,需要在白名单中同时包含你需要的核心工具或组。

示例:邮件分类

不用 Lobster:

User: "Check my email and draft replies"
→ openclaw calls gmail.list
→ LLM summarizes
→ User: "draft replies to #2 and #5"
→ LLM drafts
→ User: "send #2"
→ openclaw calls gmail.send
(repeat daily, no memory of what was triaged)

用 Lobster:

{
  "action": "run",
  "pipeline": "email.triage --limit 20",
  "timeoutMs": 30000
}

返回 JSON 信封(已截断):

{
  "ok": true,
  "status": "needs_approval",
  "output": [{ "summary": "5 need replies, 2 need action" }],
  "requiresApproval": {
    "type": "approval_request",
    "prompt": "Send 2 draft replies?",
    "items": [],
    "resumeToken": "..."
  }
}

用户批准 → 恢复:

{
  "action": "resume",
  "token": "<resumeToken>",
  "approve": true
}

一个工作流。确定性。安全。

工具参数

run

在工具模式下运行管线。

{
  "action": "run",
  "pipeline": "gog.gmail.search --query 'newer_than:1d' | email.triage",
  "cwd": "workspace",
  "timeoutMs": 30000,
  "maxStdoutBytes": 512000
}

用参数运行工作流文件:

{
  "action": "run",
  "pipeline": "/path/to/inbox-triage.lobster",
  "argsJson": "{\"tag\":\"family\"}"
}

resume

审批后继续暂停的工作流。

{
  "action": "resume",
  "token": "<resumeToken>",
  "approve": true
}

可选输入

  • cwd:管线的相对工作目录(必须在当前进程工作目录内)。
  • timeoutMs:子进程超时后终止(默认 20000)。
  • maxStdoutBytes:stdout 超过此大小时终止子进程(默认 512000)。
  • argsJson:传给 lobster run --args-json 的 JSON 字符串(仅工作流文件)。

输出信封

Lobster 返回一个 JSON 信封,有三种状态:

  • ok → 成功完成
  • needs_approval → 已暂停;需要 requiresApproval.resumeToken 来恢复
  • cancelled → 被明确拒绝或取消

工具在 content(格式化 JSON)和 details(原始对象)中都展示该信封。

审批

如果存在 requiresApproval,查看提示信息后决定:

  • approve: true → 恢复并继续执行副作用
  • approve: false → 取消并结束工作流

使用 approve --preview-from-stdin --limit N 将 JSON 预览附加到审批请求,无需自定义 jq/heredoc 拼接。恢复 token 现在更紧凑了:Lobster 将工作流恢复状态存储在其状态目录下,只返回一个小的 token key。

OpenProse

OpenProse 和 Lobster 配合得很好:用 /prose 编排多 Agent 准备工作,然后用 Lobster 管线处理确定性审批。如果 Prose 程序需要 Lobster,通过 tools.subagents.tools 为子 Agent 允许 lobster 工具。参见 OpenProse

安全

  • 仅本地子进程 — 插件本身不发起网络调用。
  • 不管理密钥 — Lobster 不处理 OAuth;它调用处理 OAuth 的 OpenClaw 工具。
  • 沙箱感知 — 工具上下文在沙箱中时禁用。
  • 加固 — 固定可执行文件名(lobster)在 PATH 上;强制执行超时和输出上限。

故障排查

  • lobster subprocess timed out → 增大 timeoutMs,或拆分长管线。
  • lobster output exceeded maxStdoutBytes → 增大 maxStdoutBytes 或减少输出量。
  • lobster returned invalid JSON → 确保管线在工具模式下运行且只输出 JSON。
  • lobster failed (code …) → 在终端中运行相同管线查看 stderr。

了解更多

案例:社区工作流

一个公开案例:一套”第二大脑” CLI + Lobster 管线,管理三个 Markdown 仓库(个人、伴侣、共享)。CLI 输出 JSON 格式的统计、收件箱列表和过期扫描;Lobster 把这些命令串成 weekly-reviewinbox-triagememory-consolidationshared-task-sync 等工作流,每个都有审批节点。AI 负责判断(分类),可用时走 AI,不可用时回退到确定性规则。