Venice AI(Venice 精选)
Venice 是我们精选的 Venice 配置方案,主打隐私优先推理,并可选择通过匿名代理访问商业模型。
Venice AI 提供注重隐私的 AI 推理服务,支持无审查模型,也可以通过匿名代理访问主要商业模型。所有推理默认私密——不会用你的数据训练,不记录日志。
为什么在 OpenClaw 中用 Venice
- 私密推理:开源模型不记录日志。
- 无审查模型:需要时随时可用。
- 匿名访问商业模型(Opus/GPT/Gemini):需要质量时切换过去。
- 兼容 OpenAI
/v1端点。
隐私模式
Venice 提供两种隐私级别——理解这一点是选模型的关键:
| 模式 | 说明 | 模型 |
|---|---|---|
| 私密 | 完全私密。提示和响应从不存储或记录。用完即弃。 | Llama、Qwen、DeepSeek、Kimi、MiniMax、Venice Uncensored 等 |
| 匿名 | 通过 Venice 代理转发,去除元数据。底层提供商(OpenAI、Anthropic、Google、xAI)看到的是匿名请求。 | Claude、GPT、Gemini、Grok |
功能特性
- 隐私优先:可在”私密”(完全私密)和”匿名”(代理转发)模式间选择
- 无审查模型:提供无内容限制的模型
- 主流模型访问:通过 Venice 匿名代理使用 Claude、GPT、Gemini、Grok
- 兼容 OpenAI API:标准
/v1端点,集成方便 - 流式传输:所有模型支持
- 函数调用:部分模型支持(具体请查看模型能力)
- 视觉能力:支持视觉功能的模型可用
- 无硬性速率限制:极端使用情况下可能触发公平使用限流
配置
1. 获取 API 密钥
- 在 venice.ai 注册
- 进入 Settings → API Keys → Create new key
- 复制 API 密钥(格式:
vapi_xxxxxxxxxxxx)
2. 配置 OpenClaw
方式 A:环境变量
export VENICE_API_KEY="vapi_xxxxxxxxxxxx"
方式 B:交互式配置(推荐)
openclaw onboard --auth-choice venice-api-key
这会:
- 提示输入 API 密钥(或使用已有的
VENICE_API_KEY) - 展示所有可用的 Venice 模型
- 让你选择默认模型
- 自动完成提供商配置
方式 C:非交互模式
openclaw onboard --non-interactive \
--auth-choice venice-api-key \
--venice-api-key "vapi_xxxxxxxxxxxx"
3. 验证配置
openclaw agent --model venice/kimi-k2-5 --message "Hello, are you working?"
模型选择
配置完成后,OpenClaw 会展示所有可用的 Venice 模型。根据需求选择:
- 默认模型:
venice/kimi-k2-5,私密推理能力强,还支持视觉。 - 高能力选项:
venice/claude-opus-4-6,通过 Venice 匿名路径获取最强性能。 - 隐私优先:选择”私密”模型,推理完全不留痕。
- 能力优先:选择”匿名”模型,通过 Venice 代理使用 Claude、GPT、Gemini。
随时切换默认模型:
openclaw models set venice/kimi-k2-5
openclaw models set venice/claude-opus-4-6
列出所有可用模型:
openclaw models list | grep venice
通过 openclaw configure 配置
- 运行
openclaw configure - 选择 Model/auth
- 选择 Venice AI
该用哪个模型?
| 使用场景 | 推荐模型 | 原因 |
|---|---|---|
| 日常聊天(默认) | kimi-k2-5 | 私密推理能力强,还支持视觉 |
| 最佳综合质量 | claude-opus-4-6 | Venice 匿名路径中最强的选项 |
| 隐私 + 编程 | qwen3-coder-480b-a35b-instruct | 私密编程模型,上下文窗口大 |
| 私密视觉 | kimi-k2-5 | 在私密模式下也支持视觉 |
| 快速 + 低成本 | qwen3-4b | 轻量推理模型 |
| 复杂私密任务 | deepseek-v3.2 | 推理能力强,但不支持 Venice 工具调用 |
| 无审查 | venice-uncensored | 无内容限制 |
可用模型(共 41 个)
私密模型(26 个)——完全私密,无日志
| 模型 ID | 名称 | 上下文 | 特性 |
|---|---|---|---|
kimi-k2-5 | Kimi K2.5 | 256k | 默认,推理,视觉 |
kimi-k2-thinking | Kimi K2 Thinking | 256k | 推理 |
llama-3.3-70b | Llama 3.3 70B | 128k | 通用 |
llama-3.2-3b | Llama 3.2 3B | 128k | 通用 |
hermes-3-llama-3.1-405b | Hermes 3 Llama 3.1 405B | 128k | 通用,工具调用已禁用 |
qwen3-235b-a22b-thinking-2507 | Qwen3 235B Thinking | 128k | 推理 |
qwen3-235b-a22b-instruct-2507 | Qwen3 235B Instruct | 128k | 通用 |
qwen3-coder-480b-a35b-instruct | Qwen3 Coder 480B | 256k | 编程 |
qwen3-coder-480b-a35b-instruct-turbo | Qwen3 Coder 480B Turbo | 256k | 编程 |
qwen3-5-35b-a3b | Qwen3.5 35B A3B | 256k | 推理,视觉 |
qwen3-next-80b | Qwen3 Next 80B | 256k | 通用 |
qwen3-vl-235b-a22b | Qwen3 VL 235B(视觉) | 256k | 视觉 |
qwen3-4b | Venice Small (Qwen3 4B) | 32k | 快速,推理 |
deepseek-v3.2 | DeepSeek V3.2 | 160k | 推理,工具调用已禁用 |
venice-uncensored | Venice Uncensored (Dolphin-Mistral) | 32k | 无审查,工具调用已禁用 |
mistral-31-24b | Venice Medium (Mistral) | 128k | 视觉 |
google-gemma-3-27b-it | Google Gemma 3 27B Instruct | 198k | 视觉 |
openai-gpt-oss-120b | OpenAI GPT OSS 120B | 128k | 通用 |
nvidia-nemotron-3-nano-30b-a3b | NVIDIA Nemotron 3 Nano 30B | 128k | 通用 |
olafangensan-glm-4.7-flash-heretic | GLM 4.7 Flash Heretic | 128k | 推理 |
zai-org-glm-4.6 | GLM 4.6 | 198k | 通用 |
zai-org-glm-4.7 | GLM 4.7 | 198k | 推理 |
zai-org-glm-4.7-flash | GLM 4.7 Flash | 128k | 推理 |
zai-org-glm-5 | GLM 5 | 198k | 推理 |
minimax-m21 | MiniMax M2.1 | 198k | 推理 |
minimax-m25 | MiniMax M2.5 | 198k | 推理 |
匿名模型(15 个)——通过 Venice 代理
| 模型 ID | 名称 | 上下文 | 特性 |
|---|---|---|---|
claude-opus-4-6 | Claude Opus 4.6 (via Venice) | 1M | 推理,视觉 |
claude-opus-4-5 | Claude Opus 4.5 (via Venice) | 198k | 推理,视觉 |
claude-sonnet-4-6 | Claude Sonnet 4.6 (via Venice) | 1M | 推理,视觉 |
claude-sonnet-4-5 | Claude Sonnet 4.5 (via Venice) | 198k | 推理,视觉 |
openai-gpt-54 | GPT-5.4 (via Venice) | 1M | 推理,视觉 |
openai-gpt-53-codex | GPT-5.3 Codex (via Venice) | 400k | 推理,视觉,编程 |
openai-gpt-52 | GPT-5.2 (via Venice) | 256k | 推理 |
openai-gpt-52-codex | GPT-5.2 Codex (via Venice) | 256k | 推理,视觉,编程 |
openai-gpt-4o-2024-11-20 | GPT-4o (via Venice) | 128k | 视觉 |
openai-gpt-4o-mini-2024-07-18 | GPT-4o Mini (via Venice) | 128k | 视觉 |
gemini-3-1-pro-preview | Gemini 3.1 Pro (via Venice) | 1M | 推理,视觉 |
gemini-3-pro-preview | Gemini 3 Pro (via Venice) | 198k | 推理,视觉 |
gemini-3-flash-preview | Gemini 3 Flash (via Venice) | 256k | 推理,视觉 |
grok-41-fast | Grok 4.1 Fast (via Venice) | 1M | 推理,视觉 |
grok-code-fast-1 | Grok Code Fast 1 (via Venice) | 256k | 推理,编程 |
模型发现
当 VENICE_API_KEY 设置后,OpenClaw 会自动从 Venice API 发现模型。如果 API 不可达,会回退到静态目录。
/models 端点是公开的(列出模型不需要认证),但推理需要有效的 API 密钥。
流式传输和工具支持
| 功能 | 支持情况 |
|---|---|
| 流式传输 | 所有模型支持 |
| 函数调用 | 大部分模型支持(可查看 API 中的 supportsFunctionCalling) |
| 视觉/图像 | 标有”视觉”特性的模型支持 |
| JSON 模式 | 通过 response_format 支持 |
定价
Venice 使用积分制。当前费率详见 venice.ai/pricing:
- 私密模型:通常费用更低
- 匿名模型:与直接 API 定价相近,外加少量 Venice 费用
对比:Venice vs 直接调用 API
| 方面 | Venice(匿名模式) | 直接调用 API |
|---|---|---|
| 隐私 | 去除元数据,匿名化 | 关联到你的账户 |
| 延迟 | +10-50ms(代理开销) | 直连 |
| 功能 | 大部分功能支持 | 完整功能 |
| 计费 | Venice 积分 | 提供商计费 |
使用示例
# 使用默认私密模型
openclaw agent --model venice/kimi-k2-5 --message "Quick health check"
# 通过 Venice 使用 Claude Opus(匿名模式)
openclaw agent --model venice/claude-opus-4-6 --message "Summarize this task"
# 使用无审查模型
openclaw agent --model venice/venice-uncensored --message "Draft options"
# 使用视觉模型
openclaw agent --model venice/qwen3-vl-235b-a22b --message "Review attached image"
# 使用编程模型
openclaw agent --model venice/qwen3-coder-480b-a35b-instruct --message "Refactor this function"
常见问题排查
API 密钥无法识别
echo $VENICE_API_KEY
openclaw models list | grep venice
确保密钥以 vapi_ 开头。
模型不可用
Venice 的模型目录是动态更新的。运行 openclaw models list 查看当前可用模型。部分模型可能临时下线。
连接问题
Venice API 地址为 https://api.venice.ai/api/v1。请确保网络允许 HTTPS 连接。
配置文件示例
{
env: { VENICE_API_KEY: "vapi_..." },
agents: { defaults: { model: { primary: "venice/kimi-k2-5" } } },
models: {
mode: "merge",
providers: {
venice: {
baseUrl: "https://api.venice.ai/api/v1",
apiKey: "${VENICE_API_KEY}",
api: "openai-completions",
models: [
{
id: "kimi-k2-5",
name: "Kimi K2.5",
reasoning: true,
input: ["text", "image"],
cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
contextWindow: 256000,
maxTokens: 65536,
},
],
},
},
},
}