Fly.io 部署

目标:Fly.io 机器上运行 OpenClaw Gateway,带有持久存储、自动 HTTPS 和 Discord/渠道访问。

前置条件

  • 安装了 flyctl CLI
  • Fly.io 账号(免费层即可)
  • 模型认证:所选模型提供商的 API key
  • 渠道凭据:Discord bot token、Telegram token 等

新手快速上手

  1. 克隆仓库 → 自定义 fly.toml
  2. 创建应用 + 卷 → 设置密钥
  3. fly deploy 部署
  4. SSH 进去创建配置或使用 Control UI

1) 创建 Fly 应用

# 克隆仓库
git clone https://github.com/openclaw/openclaw.git
cd openclaw

# 创建新的 Fly 应用(用你自己的名字)
fly apps create my-openclaw

# 创建持久卷(1GB 通常够用)
fly volumes create openclaw_data --size 1 --region iad

提示: 选择离你近的区域。常见选项:lhr(伦敦)、iad(弗吉尼亚)、sjc(圣何塞)。

2) 配置 fly.toml

编辑 fly.toml 以匹配你的应用名和需求。

安全提示: 默认配置会暴露公共 URL。要实现无公网 IP 的加固部署,请参阅私有部署或使用 fly.private.toml

app = "my-openclaw"  # Your app name
primary_region = "iad"

[build]
  dockerfile = "Dockerfile"

[env]
  NODE_ENV = "production"
  OPENCLAW_PREFER_PNPM = "1"
  OPENCLAW_STATE_DIR = "/data"
  NODE_OPTIONS = "--max-old-space-size=1536"

[processes]
  app = "node dist/index.js gateway --allow-unconfigured --port 3000 --bind lan"

[http_service]
  internal_port = 3000
  force_https = true
  auto_stop_machines = false
  auto_start_machines = true
  min_machines_running = 1
  processes = ["app"]

[[vm]]
  size = "shared-cpu-2x"
  memory = "2048mb"

[mounts]
  source = "openclaw_data"
  destination = "/data"

关键设置:

设置原因
--bind lan绑定到 0.0.0.0,让 Fly 代理能访问网关
--allow-unconfigured无配置文件时也能启动(之后再创建)
internal_port = 3000必须与 --port 3000(或 OPENCLAW_GATEWAY_PORT)匹配,用于 Fly 健康检查
memory = "2048mb"512MB 太小,推荐 2GB
OPENCLAW_STATE_DIR = "/data"将状态持久化到卷上

3) 设置密钥

# 必须:网关 token(非回环绑定时需要)
fly secrets set OPENCLAW_GATEWAY_TOKEN=$(openssl rand -hex 32)

# 模型提供商 API key
fly secrets set ANTHROPIC_API_KEY=sk-ant-...

# 可选:其他提供商
fly secrets set OPENAI_API_KEY=sk-...
fly secrets set GOOGLE_API_KEY=...

# 渠道 token
fly secrets set DISCORD_BOT_TOKEN=MTQ...

说明:

  • 非回环绑定(--bind lan)需要设置 OPENCLAW_GATEWAY_TOKEN 以确保安全。
  • 把这些 token 当密码一样保管。
  • 优先使用环境变量而非配置文件来存放所有 API key 和 token。这样可以避免它们出现在 openclaw.json 中被意外暴露或记录。

4) 部署

fly deploy

首次部署会构建 Docker 镜像(约 2-3 分钟)。后续部署更快。

部署后验证:

fly status
fly logs

你应该能看到:

[gateway] listening on ws://0.0.0.0:3000 (PID xxx)
[discord] logged in to discord as xxx

5) 创建配置文件

SSH 进入机器创建正式配置:

fly ssh console

创建配置目录和文件:

mkdir -p /data
cat > /data/openclaw.json << 'EOF'
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-opus-4-6",
        "fallbacks": ["anthropic/claude-sonnet-4-5", "openai/gpt-4o"]
      },
      "maxConcurrent": 4
    },
    "list": [
      {
        "id": "main",
        "default": true
      }
    ]
  },
  "auth": {
    "profiles": {
      "anthropic:default": { "mode": "token", "provider": "anthropic" },
      "openai:default": { "mode": "token", "provider": "openai" }
    }
  },
  "bindings": [
    {
      "agentId": "main",
      "match": { "channel": "discord" }
    }
  ],
  "channels": {
    "discord": {
      "enabled": true,
      "groupPolicy": "allowlist",
      "guilds": {
        "YOUR_GUILD_ID": {
          "channels": { "general": { "allow": true } },
          "requireMention": false
        }
      }
    }
  },
  "gateway": {
    "mode": "local",
    "bind": "auto"
  },
  "meta": {
    "lastTouchedVersion": "2026.1.29"
  }
}
EOF

注意: 设置了 OPENCLAW_STATE_DIR=/data 后,配置路径为 /data/openclaw.json

注意: Discord token 可以来自:

  • 环境变量:DISCORD_BOT_TOKEN(推荐用于密钥)
  • 配置文件:channels.discord.token

如果使用环境变量,配置中无需添加 token。网关会自动读取 DISCORD_BOT_TOKEN

重启使配置生效:

exit
fly machine restart <machine-id>

6) 访问网关

Control UI

在浏览器中打开:

fly open

或访问 https://my-openclaw.fly.dev/

粘贴你的网关 token(即 OPENCLAW_GATEWAY_TOKEN 的值)进行认证。

日志

fly logs              # 实时日志
fly logs --no-tail    # 最近的日志

SSH 控制台

fly ssh console

排错

”App is not listening on expected address”

网关绑定到了 127.0.0.1 而非 0.0.0.0

修复:fly.toml 的 process 命令中添加 --bind lan

健康检查失败 / 连接被拒

Fly 无法通过配置的端口访问网关。

修复: 确保 internal_port 与网关端口一致(设置 --port 3000OPENCLAW_GATEWAY_PORT=3000)。

OOM / 内存问题

容器持续重启或被杀死。表现:SIGABRTv8::internal::Runtime_AllocateInYoungGeneration,或无声重启。

修复:fly.toml 中增加内存:

[[vm]]
  memory = "2048mb"

或更新现有机器:

fly machine update <machine-id> --vm-memory 2048 -y

注意: 512MB 太小。1GB 勉强够用但在负载或详细日志时可能 OOM。推荐 2GB。

网关锁问题

网关拒绝启动,报 “already running” 错误。

这通常发生在容器重启但 PID 锁文件在卷上持久化了。

修复: 删除锁文件:

fly ssh console --command "rm -f /data/gateway.*.lock"
fly machine restart <machine-id>

锁文件位于 /data/gateway.*.lock(不在子目录中)。

配置未被读取

使用 --allow-unconfigured 时,网关会创建最小配置。重启后应该会读取你在 /data/openclaw.json 的自定义配置。

验证配置是否存在:

fly ssh console --command "cat /data/openclaw.json"

通过 SSH 写入配置

fly ssh console -C 命令不支持 shell 重定向。写入配置文件的方法:

# 使用 echo + tee(从本地管道到远程)
echo '{"your":"config"}' | fly ssh console -C "tee /data/openclaw.json"

# 或使用 sftp
fly sftp shell
> put /local/path/config.json /data/openclaw.json

注意: 如果文件已存在,fly sftp 可能会失败。先删除:

fly ssh console --command "rm /data/openclaw.json"

状态未持久化

如果重启后丢失了凭据或会话,说明状态目录写到了容器文件系统。

修复: 确保 fly.toml 中设置了 OPENCLAW_STATE_DIR=/data 并重新部署。

更新

# 拉取最新代码
git pull

# 重新部署
fly deploy

# 检查健康状态
fly status
fly logs

更新机器命令

如果需要更改启动命令而不做完整重新部署:

# 获取机器 ID
fly machines list

# 更新命令
fly machine update <machine-id> --command "node dist/index.js gateway --port 3000 --bind lan" -y

# 或同时增加内存
fly machine update <machine-id> --vm-memory 2048 --command "node dist/index.js gateway --port 3000 --bind lan" -y

注意: fly deploy 后,机器命令可能会重置为 fly.toml 中的值。如果之前做了手动更改,部署后需重新应用。

私有部署(加固版)

默认情况下,Fly 会分配公网 IP,使你的网关可通过 https://your-app.fly.dev 访问。这很方便,但也意味着你的部署对互联网扫描器(Shodan、Censys 等)可见。

对于不暴露公网的加固部署,使用私有模板。

何时使用私有部署

  • 你只进行出站调用/消息(无入站 webhook)
  • 你使用 ngrok 或 Tailscale 隧道处理 webhook 回调
  • 你通过 SSH、代理或 WireGuard 访问网关,而非浏览器
  • 你希望部署对互联网扫描器不可见

配置

使用 fly.private.toml 代替标准配置:

# 使用私有配置部署
fly deploy -c fly.private.toml

或转换现有部署:

# 列出当前 IP
fly ips list -a my-openclaw

# 释放公网 IP
fly ips release <public-ipv4> -a my-openclaw
fly ips release <public-ipv6> -a my-openclaw

# 切换到私有配置,确保后续部署不再分配公网 IP
# (删除 [http_service] 或使用私有模板部署)
fly deploy -c fly.private.toml

# 分配仅限私有的 IPv6
fly ips allocate-v6 --private -a my-openclaw

之后,fly ips list 应该只显示 private 类型的 IP:

VERSION  IP                   TYPE             REGION
v6       fdaa:x:x:x:x::x      private          global

访问私有部署

没有公网 URL,使用以下方式之一:

方式一:本地代理(最简单)

# 将本地 3000 端口转发到应用
fly proxy 3000:3000 -a my-openclaw

# 然后在浏览器中打开 http://localhost:3000

方式二:WireGuard VPN

# 创建 WireGuard 配置(一次性)
fly wireguard create

# 导入 WireGuard 客户端,然后通过内部 IPv6 访问
# 示例:http://[fdaa:x:x:x:x::x]:3000

方式三:仅 SSH

fly ssh console -a my-openclaw

私有部署下的 Webhook

如果需要 webhook 回调(Twilio、Telnyx 等)但不想暴露公网:

  1. ngrok 隧道 - 在容器内或作为 sidecar 运行 ngrok
  2. Tailscale Funnel - 通过 Tailscale 暴露特定路径
  3. 纯出站 - 部分提供商(Twilio)纯出站调用无需 webhook 也能工作

ngrok 语音通话配置示例:

{
  "plugins": {
    "entries": {
      "voice-call": {
        "enabled": true,
        "config": {
          "provider": "twilio",
          "tunnel": { "provider": "ngrok" },
          "webhookSecurity": {
            "allowedHosts": ["example.ngrok.app"]
          }
        }
      }
    }
  }
}

ngrok 隧道在容器内运行,提供公共 webhook URL 而不暴露 Fly 应用本身。设置 webhookSecurity.allowedHosts 为公共隧道主机名,以接受转发的 host header。

安全对比

方面公开部署私有部署
互联网扫描器可发现隐藏
直接攻击可能被阻止
Control UI 访问浏览器代理/VPN
Webhook 传递直连通过隧道

补充说明

  • Fly.io 使用 x86 架构(非 ARM)
  • Dockerfile 兼容两种架构
  • WhatsApp/Telegram 引导流程请使用 fly ssh console
  • 持久数据存储在 /data 卷上
  • Signal 需要 Java + signal-cli;使用自定义镜像并保持内存 2GB+。

费用

使用推荐配置(shared-cpu-2x,2GB RAM):

  • 约 $10-15/月,取决于使用量
  • 免费层包含一定额度

详见 Fly.io 定价