Venice AI（Venice 精选）

Venice 是我们精选的 Venice 配置方案，主打隐私优先推理，并可选择通过匿名代理访问商业模型。

Venice AI 提供注重隐私的 AI 推理服务，支持无审查模型，也可以通过匿名代理访问主要商业模型。所有推理默认私密——不会用你的数据训练，不记录日志。

为什么在 OpenClaw 中用 Venice

私密推理：开源模型不记录日志。
无审查模型：需要时随时可用。
匿名访问商业模型（Opus/GPT/Gemini）：需要质量时切换过去。
兼容 OpenAI /v1 端点。

隐私模式

Venice 提供两种隐私级别——理解这一点是选模型的关键：

模式	说明	模型
私密	完全私密。提示和响应从不存储或记录。用完即弃。	Llama、Qwen、DeepSeek、Kimi、MiniMax、Venice Uncensored 等
匿名	通过 Venice 代理转发，去除元数据。底层提供商（OpenAI、Anthropic、Google、xAI）看到的是匿名请求。	Claude、GPT、Gemini、Grok

功能特性

隐私优先：可在”私密”（完全私密）和”匿名”（代理转发）模式间选择
无审查模型：提供无内容限制的模型
主流模型访问：通过 Venice 匿名代理使用 Claude、GPT、Gemini、Grok
兼容 OpenAI API：标准 /v1 端点，集成方便
流式传输：所有模型支持
函数调用：部分模型支持（具体请查看模型能力）
视觉能力：支持视觉功能的模型可用
无硬性速率限制：极端使用情况下可能触发公平使用限流

配置

1. 获取 API 密钥

在 venice.ai 注册
进入 Settings → API Keys → Create new key
复制 API 密钥（格式：vapi_xxxxxxxxxxxx）

2. 配置 OpenClaw

方式 A：环境变量

export VENICE_API_KEY="vapi_xxxxxxxxxxxx"

方式 B：交互式配置（推荐）

openclaw onboard --auth-choice venice-api-key

这会：

提示输入 API 密钥（或使用已有的 VENICE_API_KEY）
展示所有可用的 Venice 模型
让你选择默认模型
自动完成提供商配置

方式 C：非交互模式

openclaw onboard --non-interactive \
  --auth-choice venice-api-key \
  --venice-api-key "vapi_xxxxxxxxxxxx"

3. 验证配置

openclaw agent --model venice/kimi-k2-5 --message "Hello, are you working?"

模型选择

配置完成后，OpenClaw 会展示所有可用的 Venice 模型。根据需求选择：

默认模型：venice/kimi-k2-5，私密推理能力强，还支持视觉。
高能力选项：venice/claude-opus-4-6，通过 Venice 匿名路径获取最强性能。
隐私优先：选择”私密”模型，推理完全不留痕。
能力优先：选择”匿名”模型，通过 Venice 代理使用 Claude、GPT、Gemini。

随时切换默认模型：

openclaw models set venice/kimi-k2-5
openclaw models set venice/claude-opus-4-6

列出所有可用模型：

openclaw models list | grep venice

通过 `openclaw configure` 配置

运行 openclaw configure
选择 Model/auth
选择 Venice AI

该用哪个模型？

使用场景	推荐模型	原因
日常聊天（默认）	`kimi-k2-5`	私密推理能力强，还支持视觉
最佳综合质量	`claude-opus-4-6`	Venice 匿名路径中最强的选项
隐私 + 编程	`qwen3-coder-480b-a35b-instruct`	私密编程模型，上下文窗口大
私密视觉	`kimi-k2-5`	在私密模式下也支持视觉
快速 + 低成本	`qwen3-4b`	轻量推理模型
复杂私密任务	`deepseek-v3.2`	推理能力强，但不支持 Venice 工具调用
无审查	`venice-uncensored`	无内容限制

可用模型（共 41 个）

私密模型（26 个）——完全私密，无日志

模型 ID	名称	上下文	特性
`kimi-k2-5`	Kimi K2.5	256k	默认，推理，视觉
`kimi-k2-thinking`	Kimi K2 Thinking	256k	推理
`llama-3.3-70b`	Llama 3.3 70B	128k	通用
`llama-3.2-3b`	Llama 3.2 3B	128k	通用
`hermes-3-llama-3.1-405b`	Hermes 3 Llama 3.1 405B	128k	通用，工具调用已禁用
`qwen3-235b-a22b-thinking-2507`	Qwen3 235B Thinking	128k	推理
`qwen3-235b-a22b-instruct-2507`	Qwen3 235B Instruct	128k	通用
`qwen3-coder-480b-a35b-instruct`	Qwen3 Coder 480B	256k	编程
`qwen3-coder-480b-a35b-instruct-turbo`	Qwen3 Coder 480B Turbo	256k	编程
`qwen3-5-35b-a3b`	Qwen3.5 35B A3B	256k	推理，视觉
`qwen3-next-80b`	Qwen3 Next 80B	256k	通用
`qwen3-vl-235b-a22b`	Qwen3 VL 235B（视觉）	256k	视觉
`qwen3-4b`	Venice Small (Qwen3 4B)	32k	快速，推理
`deepseek-v3.2`	DeepSeek V3.2	160k	推理，工具调用已禁用
`venice-uncensored`	Venice Uncensored (Dolphin-Mistral)	32k	无审查，工具调用已禁用
`mistral-31-24b`	Venice Medium (Mistral)	128k	视觉
`google-gemma-3-27b-it`	Google Gemma 3 27B Instruct	198k	视觉
`openai-gpt-oss-120b`	OpenAI GPT OSS 120B	128k	通用
`nvidia-nemotron-3-nano-30b-a3b`	NVIDIA Nemotron 3 Nano 30B	128k	通用
`olafangensan-glm-4.7-flash-heretic`	GLM 4.7 Flash Heretic	128k	推理
`zai-org-glm-4.6`	GLM 4.6	198k	通用
`zai-org-glm-4.7`	GLM 4.7	198k	推理
`zai-org-glm-4.7-flash`	GLM 4.7 Flash	128k	推理
`zai-org-glm-5`	GLM 5	198k	推理
`minimax-m21`	MiniMax M2.1	198k	推理
`minimax-m25`	MiniMax M2.5	198k	推理

匿名模型（15 个）——通过 Venice 代理

模型 ID	名称	上下文	特性
`claude-opus-4-6`	Claude Opus 4.6 (via Venice)	1M	推理，视觉
`claude-opus-4-5`	Claude Opus 4.5 (via Venice)	198k	推理，视觉
`claude-sonnet-4-6`	Claude Sonnet 4.6 (via Venice)	1M	推理，视觉
`claude-sonnet-4-5`	Claude Sonnet 4.5 (via Venice)	198k	推理，视觉
`openai-gpt-54`	GPT-5.4 (via Venice)	1M	推理，视觉
`openai-gpt-53-codex`	GPT-5.3 Codex (via Venice)	400k	推理，视觉，编程
`openai-gpt-52`	GPT-5.2 (via Venice)	256k	推理
`openai-gpt-52-codex`	GPT-5.2 Codex (via Venice)	256k	推理，视觉，编程
`openai-gpt-4o-2024-11-20`	GPT-4o (via Venice)	128k	视觉
`openai-gpt-4o-mini-2024-07-18`	GPT-4o Mini (via Venice)	128k	视觉
`gemini-3-1-pro-preview`	Gemini 3.1 Pro (via Venice)	1M	推理，视觉
`gemini-3-pro-preview`	Gemini 3 Pro (via Venice)	198k	推理，视觉
`gemini-3-flash-preview`	Gemini 3 Flash (via Venice)	256k	推理，视觉
`grok-41-fast`	Grok 4.1 Fast (via Venice)	1M	推理，视觉
`grok-code-fast-1`	Grok Code Fast 1 (via Venice)	256k	推理，编程

模型发现

当 VENICE_API_KEY 设置后，OpenClaw 会自动从 Venice API 发现模型。如果 API 不可达，会回退到静态目录。

/models 端点是公开的（列出模型不需要认证），但推理需要有效的 API 密钥。

流式传输和工具支持

功能	支持情况
流式传输	所有模型支持
函数调用	大部分模型支持（可查看 API 中的 `supportsFunctionCalling`）
视觉/图像	标有”视觉”特性的模型支持
JSON 模式	通过 `response_format` 支持

定价

Venice 使用积分制。当前费率详见 venice.ai/pricing：

私密模型：通常费用更低
匿名模型：与直接 API 定价相近，外加少量 Venice 费用

对比：Venice vs 直接调用 API

方面	Venice（匿名模式）	直接调用 API
隐私	去除元数据，匿名化	关联到你的账户
延迟	+10-50ms（代理开销）	直连
功能	大部分功能支持	完整功能
计费	Venice 积分	提供商计费

使用示例

# 使用默认私密模型
openclaw agent --model venice/kimi-k2-5 --message "Quick health check"

# 通过 Venice 使用 Claude Opus（匿名模式）
openclaw agent --model venice/claude-opus-4-6 --message "Summarize this task"

# 使用无审查模型
openclaw agent --model venice/venice-uncensored --message "Draft options"

# 使用视觉模型
openclaw agent --model venice/qwen3-vl-235b-a22b --message "Review attached image"

# 使用编程模型
openclaw agent --model venice/qwen3-coder-480b-a35b-instruct --message "Refactor this function"

常见问题排查

API 密钥无法识别

echo $VENICE_API_KEY
openclaw models list | grep venice

确保密钥以 vapi_ 开头。

模型不可用

Venice 的模型目录是动态更新的。运行 openclaw models list 查看当前可用模型。部分模型可能临时下线。

连接问题

Venice API 地址为 https://api.venice.ai/api/v1。请确保网络允许 HTTPS 连接。

配置文件示例

{
  env: { VENICE_API_KEY: "vapi_..." },
  agents: { defaults: { model: { primary: "venice/kimi-k2-5" } } },
  models: {
    mode: "merge",
    providers: {
      venice: {
        baseUrl: "https://api.venice.ai/api/v1",
        apiKey: "${VENICE_API_KEY}",
        api: "openai-completions",
        models: [
          {
            id: "kimi-k2-5",
            name: "Kimi K2.5",
            reasoning: true,
            input: ["text", "image"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 256000,
            maxTokens: 65536,
          },
        ],
      },
    },
  },
}