Modell-Provider
Diese Seite behandelt LLM/Modell-Provider (nicht Chat-Kanaele wie WhatsApp/Telegram). Fuer Modellauswahlregeln siehe /concepts/models.
Kurzregeln
- Model-Refs verwenden
provider/model(Beispiel:opencode/claude-opus-4-6). - Wenn du
agents.defaults.modelssetzt, wird es zur Allowlist. - CLI-Helfer:
openclaw onboard,openclaw models list,openclaw models set <provider/model>.
API-Schluessel-Rotation
- Unterstuetzt generische Provider-Rotation fuer ausgewaehlte Provider.
- Konfiguriere mehrere Schluessel ueber:
OPENCLAW_LIVE_<PROVIDER>_KEY(einzelner Live-Override, hoechste Prioritaet)<PROVIDER>_API_KEYS(komma- oder semikolongetrennte Liste)<PROVIDER>_API_KEY(primaerer Schluessel)<PROVIDER>_API_KEY_*(nummerierte Liste, z.B.<PROVIDER>_API_KEY_1)
- Fuer Google-Provider wird
GOOGLE_API_KEYebenfalls als Fallback einbezogen. - Die Schluesselauswahl bewahrt die Prioritaet und dedupliziert Werte.
- Requests werden nur bei Rate-Limit-Antworten (zum Beispiel
429,rate_limit,quota,resource exhausted) mit dem naechsten Schluessel wiederholt. - Nicht-Rate-Limit-Fehler schlagen sofort fehl; keine Schluesselrotation wird versucht.
- Wenn alle Kandidaten-Schluessel fehlschlagen, wird der letzte Fehler zurueckgegeben.
Eingebaute Provider (pi-ai-Katalog)
OpenClaw wird mit dem pi-ai-Katalog ausgeliefert. Diese Provider brauchen keine
models.providers-Konfiguration; setze einfach Auth und waehle ein Modell.
OpenAI
- Provider:
openai - Auth:
OPENAI_API_KEY - Optionale Rotation:
OPENAI_API_KEYS,OPENAI_API_KEY_1,OPENAI_API_KEY_2, plusOPENCLAW_LIVE_OPENAI_KEY(einzelner Override) - Beispielmodelle:
openai/gpt-5.4,openai/gpt-5.4-pro - CLI:
openclaw onboard --auth-choice openai-api-key - Standard-Transport ist
auto(WebSocket-first, SSE-Fallback) - Override pro Modell ueber
agents.defaults.models["openai/<model>"].params.transport("sse","websocket"oder"auto") - OpenAI Responses WebSocket-Warmup ist standardmaessig aktiviert ueber
params.openaiWsWarmup(true/false) - OpenAI Priority Processing kann aktiviert werden ueber
agents.defaults.models["openai/<model>"].params.serviceTier - OpenAI Fast Mode kann pro Modell aktiviert werden ueber
agents.defaults.models["<provider>/<model>"].params.fastMode openai/gpt-5.3-codex-sparkwird in OpenClaw absichtlich unterdrueckt, weil die Live-OpenAI-API es ablehnt; Spark wird als Codex-exklusiv behandelt
{
agents: { defaults: { model: { primary: "openai/gpt-5.4" } } },
}
Anthropic
- Provider:
anthropic - Auth:
ANTHROPIC_API_KEYoderclaude setup-token - Optionale Rotation:
ANTHROPIC_API_KEYS,ANTHROPIC_API_KEY_1,ANTHROPIC_API_KEY_2, plusOPENCLAW_LIVE_ANTHROPIC_KEY(einzelner Override) - Beispielmodell:
anthropic/claude-opus-4-6 - CLI:
openclaw onboard --auth-choice token(Setup-Token einfuegen) oderopenclaw models auth paste-token --provider anthropic - API-Key-Modelle mit Direktzugriff unterstuetzen den gemeinsamen
/fast-Toggle undparams.fastMode; OpenClaw bildet das auf Anthropicservice_tierab (autovs.standard_only) - Policy-Hinweis: Setup-Token-Unterstuetzung ist technische Kompatibilitaet; Anthropic hat in der Vergangenheit einige Subscription-Nutzungen ausserhalb von Claude Code blockiert. Pruefe die aktuellen Anthropic-Bedingungen und entscheide nach deiner Risikoeinschaetzung.
- Empfehlung: Anthropic-API-Key-Auth ist der sicherere, empfohlene Weg gegenueber Subscription-Setup-Token-Auth.
{
agents: { defaults: { model: { primary: "anthropic/claude-opus-4-6" } } },
}
OpenAI Code (Codex)
- Provider:
openai-codex - Auth: OAuth (ChatGPT)
- Beispielmodell:
openai-codex/gpt-5.4 - CLI:
openclaw onboard --auth-choice openai-codexoderopenclaw models auth login --provider openai-codex - Standard-Transport ist
auto(WebSocket-first, SSE-Fallback) - Override pro Modell ueber
agents.defaults.models["openai-codex/<model>"].params.transport("sse","websocket"oder"auto") - Teilt denselben
/fast-Toggle undparams.fastMode-Config wie direkteopenai/* openai-codex/gpt-5.3-codex-sparkbleibt verfuegbar, wenn der Codex-OAuth-Katalog es bereitstellt; entitlementabhaengig- Policy-Hinweis: OpenAI Codex OAuth wird explizit fuer externe Tools/Workflows wie OpenClaw unterstuetzt.
{
agents: { defaults: { model: { primary: "openai-codex/gpt-5.4" } } },
}
OpenCode
- Auth:
OPENCODE_API_KEY(oderOPENCODE_ZEN_API_KEY) - Zen-Runtime-Provider:
opencode - Go-Runtime-Provider:
opencode-go - Beispielmodelle:
opencode/claude-opus-4-6,opencode-go/kimi-k2.5 - CLI:
openclaw onboard --auth-choice opencode-zenoderopenclaw onboard --auth-choice opencode-go
{
agents: { defaults: { model: { primary: "opencode/claude-opus-4-6" } } },
}
Google Gemini (API-Schluessel)
- Provider:
google - Auth:
GEMINI_API_KEY - Optionale Rotation:
GEMINI_API_KEYS,GEMINI_API_KEY_1,GEMINI_API_KEY_2,GOOGLE_API_KEYFallback undOPENCLAW_LIVE_GEMINI_KEY(einzelner Override) - Beispielmodelle:
google/gemini-3.1-pro-preview,google/gemini-3-flash-preview - Kompatibilitaet: Legacy-OpenClaw-Config mit
google/gemini-3.1-flash-previewwird zugoogle/gemini-3-flash-previewnormalisiert - CLI:
openclaw onboard --auth-choice gemini-api-key
Google Vertex, Antigravity und Gemini CLI
- Provider:
google-vertex,google-antigravity,google-gemini-cli - Auth: Vertex nutzt gcloud ADC; Antigravity/Gemini CLI nutzen ihre jeweiligen Auth-Flows
- Vorsicht: Antigravity und Gemini CLI OAuth in OpenClaw sind inoffizielle Integrationen. Einige Nutzer haben Google-Account-Einschraenkungen nach Nutzung von Drittanbieter-Clients berichtet. Pruefe die Google-Bedingungen und verwende einen unkritischen Account, wenn du dich dafuer entscheidest.
- Antigravity OAuth wird als gebundeltes Plugin ausgeliefert (
google-antigravity-auth, standardmaessig deaktiviert).- Aktivieren:
openclaw plugins enable google-antigravity-auth - Login:
openclaw models auth login --provider google-antigravity --set-default
- Aktivieren:
- Gemini CLI OAuth wird als gebundeltes Plugin ausgeliefert (
google-gemini-cli-auth, standardmaessig deaktiviert).- Aktivieren:
openclaw plugins enable google-gemini-cli-auth - Login:
openclaw models auth login --provider google-gemini-cli --set-default - Hinweis: Du fuegst keine Client-ID oder kein Secret in
openclaw.jsonein. Der CLI-Login-Flow speichert Tokens in Auth-Profilen auf dem Gateway-Host.
- Aktivieren:
Z.AI (GLM)
- Provider:
zai - Auth:
ZAI_API_KEY - Beispielmodell:
zai/glm-5 - CLI:
openclaw onboard --auth-choice zai-api-key- Aliase:
z.ai/*undz-ai/*werden zuzai/*normalisiert
- Aliase:
Vercel AI Gateway
- Provider:
vercel-ai-gateway - Auth:
AI_GATEWAY_API_KEY - Beispielmodell:
vercel-ai-gateway/anthropic/claude-opus-4.6 - CLI:
openclaw onboard --auth-choice ai-gateway-api-key
Kilo Gateway
- Provider:
kilocode - Auth:
KILOCODE_API_KEY - Beispielmodell:
kilocode/anthropic/claude-opus-4.6 - CLI:
openclaw onboard --kilocode-api-key <key> - Basis-URL:
https://api.kilo.ai/api/gateway/ - Erweiterter eingebauter Katalog umfasst GLM-5 Free, MiniMax M2.5 Free, GPT-5.2, Gemini 3 Pro Preview, Gemini 3 Flash Preview, Grok Code Fast 1 und Kimi K2.5.
Siehe /providers/kilocode fuer Setup-Details.
Weitere eingebaute Provider
- OpenRouter:
openrouter(OPENROUTER_API_KEY) - Beispielmodell:
openrouter/anthropic/claude-sonnet-4-5 - Kilo Gateway:
kilocode(KILOCODE_API_KEY) - Beispielmodell:
kilocode/anthropic/claude-opus-4.6 - xAI:
xai(XAI_API_KEY) - Mistral:
mistral(MISTRAL_API_KEY) - Beispielmodell:
mistral/mistral-large-latest - CLI:
openclaw onboard --auth-choice mistral-api-key - Groq:
groq(GROQ_API_KEY) - Cerebras:
cerebras(CEREBRAS_API_KEY)- GLM-Modelle auf Cerebras verwenden die IDs
zai-glm-4.7undzai-glm-4.6. - OpenAI-kompatible Basis-URL:
https://api.cerebras.ai/v1.
- GLM-Modelle auf Cerebras verwenden die IDs
- GitHub Copilot:
github-copilot(COPILOT_GITHUB_TOKEN/GH_TOKEN/GITHUB_TOKEN) - Hugging Face Inference:
huggingface(HUGGINGFACE_HUB_TOKENoderHF_TOKEN) — OpenAI-kompatibler Router; Beispielmodell:huggingface/deepseek-ai/DeepSeek-R1; CLI:openclaw onboard --auth-choice huggingface-api-key. Siehe Hugging Face (Inference).
Provider ueber models.providers (benutzerdefiniert/Basis-URL)
Verwende models.providers (oder models.json), um benutzerdefinierte Provider oder
OpenAI-/Anthropic-kompatible Proxies hinzuzufuegen.
Moonshot AI (Kimi)
Moonshot nutzt OpenAI-kompatible Endpunkte, konfiguriere es also als benutzerdefinierten Provider:
- Provider:
moonshot - Auth:
MOONSHOT_API_KEY - Beispielmodell:
moonshot/kimi-k2.5
Kimi K2 Modell-IDs:
{/_ moonshot-kimi-k2-model-refs:start _/ && null}
moonshot/kimi-k2.5moonshot/kimi-k2-0905-previewmoonshot/kimi-k2-turbo-previewmoonshot/kimi-k2-thinkingmoonshot/kimi-k2-thinking-turbo{/_ moonshot-kimi-k2-model-refs:end _/ && null}
{
agents: {
defaults: { model: { primary: "moonshot/kimi-k2.5" } },
},
models: {
mode: "merge",
providers: {
moonshot: {
baseUrl: "https://api.moonshot.ai/v1",
apiKey: "${MOONSHOT_API_KEY}",
api: "openai-completions",
models: [{ id: "kimi-k2.5", name: "Kimi K2.5" }],
},
},
},
}
Kimi Coding
Kimi Coding nutzt Moonshot AIs Anthropic-kompatiblen Endpunkt:
- Provider:
kimi-coding - Auth:
KIMI_API_KEY - Beispielmodell:
kimi-coding/k2p5
{
env: { KIMI_API_KEY: "sk-..." },
agents: {
defaults: { model: { primary: "kimi-coding/k2p5" } },
},
}
Qwen OAuth (kostenlose Stufe)
Qwen bietet OAuth-Zugang zu Qwen Coder + Vision ueber einen Device-Code-Flow. Aktiviere das gebundelte Plugin, dann logge dich ein:
openclaw plugins enable qwen-portal-auth
openclaw models auth login --provider qwen-portal --set-default
Model-Refs:
qwen-portal/coder-modelqwen-portal/vision-model
Siehe /providers/qwen fuer Setup-Details und Hinweise.
Volcano Engine (Doubao)
Volcano Engine (Huoshan Yinqing) bietet Zugang zu Doubao und anderen Modellen in China.
- Provider:
volcengine(Coding:volcengine-plan) - Auth:
VOLCANO_ENGINE_API_KEY - Beispielmodell:
volcengine/doubao-seed-1-8-251228 - CLI:
openclaw onboard --auth-choice volcengine-api-key
{
agents: {
defaults: { model: { primary: "volcengine/doubao-seed-1-8-251228" } },
},
}
Verfuegbare Modelle:
volcengine/doubao-seed-1-8-251228(Doubao Seed 1.8)volcengine/doubao-seed-code-preview-251028volcengine/kimi-k2-5-260127(Kimi K2.5)volcengine/glm-4-7-251222(GLM 4.7)volcengine/deepseek-v3-2-251201(DeepSeek V3.2 128K)
Coding-Modelle (volcengine-plan):
volcengine-plan/ark-code-latestvolcengine-plan/doubao-seed-codevolcengine-plan/kimi-k2.5volcengine-plan/kimi-k2-thinkingvolcengine-plan/glm-4.7
BytePlus (International)
BytePlus ARK bietet Zugang zu denselben Modellen wie Volcano Engine fuer internationale Nutzer.
- Provider:
byteplus(Coding:byteplus-plan) - Auth:
BYTEPLUS_API_KEY - Beispielmodell:
byteplus/seed-1-8-251228 - CLI:
openclaw onboard --auth-choice byteplus-api-key
{
agents: {
defaults: { model: { primary: "byteplus/seed-1-8-251228" } },
},
}
Verfuegbare Modelle:
byteplus/seed-1-8-251228(Seed 1.8)byteplus/kimi-k2-5-260127(Kimi K2.5)byteplus/glm-4-7-251222(GLM 4.7)
Coding-Modelle (byteplus-plan):
byteplus-plan/ark-code-latestbyteplus-plan/doubao-seed-codebyteplus-plan/kimi-k2.5byteplus-plan/kimi-k2-thinkingbyteplus-plan/glm-4.7
Synthetic
Synthetic bietet Anthropic-kompatible Modelle hinter dem synthetic-Provider:
- Provider:
synthetic - Auth:
SYNTHETIC_API_KEY - Beispielmodell:
synthetic/hf:MiniMaxAI/MiniMax-M2.5 - CLI:
openclaw onboard --auth-choice synthetic-api-key
{
agents: {
defaults: { model: { primary: "synthetic/hf:MiniMaxAI/MiniMax-M2.5" } },
},
models: {
mode: "merge",
providers: {
synthetic: {
baseUrl: "https://api.synthetic.new/anthropic",
apiKey: "${SYNTHETIC_API_KEY}",
api: "anthropic-messages",
models: [{ id: "hf:MiniMaxAI/MiniMax-M2.5", name: "MiniMax M2.5" }],
},
},
},
}
MiniMax
MiniMax wird ueber models.providers konfiguriert, da es benutzerdefinierte Endpunkte nutzt:
- MiniMax (Anthropic-kompatibel):
--auth-choice minimax-api - Auth:
MINIMAX_API_KEY
Siehe /providers/minimax fuer Setup-Details, Modelloptionen und Config-Snippets.
Ollama
Ollama wird als gebundeltes Provider-Plugin ausgeliefert und nutzt Ollamas native API:
- Provider:
ollama - Auth: keine erforderlich (lokaler Server)
- Beispielmodell:
ollama/llama3.3 - Installation: https://ollama.com/download
# Ollama installieren, dann ein Modell herunterladen:
ollama pull llama3.3
{
agents: {
defaults: { model: { primary: "ollama/llama3.3" } },
},
}
Ollama wird lokal unter http://127.0.0.1:11434 erkannt, wenn du mit
OLLAMA_API_KEY opt-in machst, und das gebundelte Provider-Plugin fuegt Ollama direkt zu
openclaw onboard und dem Modell-Picker hinzu. Siehe /providers/ollama
fuer Onboarding, Cloud/Local-Modus und benutzerdefinierte Konfiguration.
vLLM
vLLM wird als gebundeltes Provider-Plugin fuer lokale/selbstgehostete OpenAI-kompatible Server ausgeliefert:
- Provider:
vllm - Auth: Optional (haengt von deinem Server ab)
- Standard-Basis-URL:
http://127.0.0.1:8000/v1
Um die lokale Auto-Discovery zu aktivieren (jeder Wert funktioniert, wenn dein Server keine Auth erzwingt):
export VLLM_API_KEY="vllm-local"
Dann setze ein Modell (ersetze mit einer der IDs, die /v1/models zurueckgibt):
{
agents: {
defaults: { model: { primary: "vllm/your-model-id" } },
},
}
Siehe /providers/vllm fuer Details.
SGLang
SGLang wird als gebundeltes Provider-Plugin fuer schnelle selbstgehostete OpenAI-kompatible Server ausgeliefert:
- Provider:
sglang - Auth: Optional (haengt von deinem Server ab)
- Standard-Basis-URL:
http://127.0.0.1:30000/v1
Um die lokale Auto-Discovery zu aktivieren (jeder Wert funktioniert, wenn dein Server keine Auth erzwingt):
export SGLANG_API_KEY="sglang-local"
Dann setze ein Modell (ersetze mit einer der IDs, die /v1/models zurueckgibt):
{
agents: {
defaults: { model: { primary: "sglang/your-model-id" } },
},
}
Siehe /providers/sglang fuer Details.
Lokale Proxies (LM Studio, vLLM, LiteLLM usw.)
Beispiel (OpenAI-kompatibel):
{
agents: {
defaults: {
model: { primary: "lmstudio/minimax-m2.5-gs32" },
models: { "lmstudio/minimax-m2.5-gs32": { alias: "Minimax" } },
},
},
models: {
providers: {
lmstudio: {
baseUrl: "http://localhost:1234/v1",
apiKey: "LMSTUDIO_KEY",
api: "openai-completions",
models: [
{
id: "minimax-m2.5-gs32",
name: "MiniMax M2.5",
reasoning: false,
input: ["text"],
cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
contextWindow: 200000,
maxTokens: 8192,
},
],
},
},
},
}
Hinweise:
- Fuer benutzerdefinierte Provider sind
reasoning,input,cost,contextWindowundmaxTokensoptional. Wenn nicht angegeben, setzt OpenClaw folgende Standards:reasoning: falseinput: ["text"]cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 }contextWindow: 200000maxTokens: 8192
- Empfohlen: Setze explizite Werte, die zu deinen Proxy-/Modell-Limits passen.
- Fuer
api: "openai-completions"auf nicht-nativen Endpunkten (jede nicht-leerebaseUrl, deren Host nichtapi.openai.comist), erzwingt OpenClawcompat.supportsDeveloperRole: false, um Provider-400-Fehler fuer nicht unterstuetztedeveloper-Rollen zu vermeiden. - Wenn
baseUrlleer/nicht angegeben ist, behaelt OpenClaw das Standard-OpenAI-Verhalten bei (das aufapi.openai.comaufloest). - Zur Sicherheit wird ein explizites
compat.supportsDeveloperRole: trueauf nicht-nativenopenai-completions-Endpunkten trotzdem ueberschrieben.
CLI-Beispiele
openclaw onboard --auth-choice opencode-zen
openclaw models set opencode/claude-opus-4-6
openclaw models list
Siehe auch: /gateway/configuration fuer vollstaendige Konfigurationsbeispiele.