Modell-Provider

Diese Seite behandelt LLM/Modell-Provider (nicht Chat-Kanaele wie WhatsApp/Telegram). Fuer Modellauswahlregeln siehe /concepts/models.

Kurzregeln

Model-Refs verwenden provider/model (Beispiel: opencode/claude-opus-4-6).
Wenn du agents.defaults.models setzt, wird es zur Allowlist.
CLI-Helfer: openclaw onboard, openclaw models list, openclaw models set <provider/model>.

API-Schluessel-Rotation

Unterstuetzt generische Provider-Rotation fuer ausgewaehlte Provider.
Konfiguriere mehrere Schluessel ueber:
- OPENCLAW_LIVE_<PROVIDER>_KEY (einzelner Live-Override, hoechste Prioritaet)
- <PROVIDER>_API_KEYS (komma- oder semikolongetrennte Liste)
- <PROVIDER>_API_KEY (primaerer Schluessel)
- <PROVIDER>_API_KEY_* (nummerierte Liste, z.B. <PROVIDER>_API_KEY_1)
Fuer Google-Provider wird GOOGLE_API_KEY ebenfalls als Fallback einbezogen.
Die Schluesselauswahl bewahrt die Prioritaet und dedupliziert Werte.
Requests werden nur bei Rate-Limit-Antworten (zum Beispiel 429, rate_limit, quota, resource exhausted) mit dem naechsten Schluessel wiederholt.
Nicht-Rate-Limit-Fehler schlagen sofort fehl; keine Schluesselrotation wird versucht.
Wenn alle Kandidaten-Schluessel fehlschlagen, wird der letzte Fehler zurueckgegeben.

Eingebaute Provider (pi-ai-Katalog)

OpenClaw wird mit dem pi-ai-Katalog ausgeliefert. Diese Provider brauchen keine models.providers-Konfiguration; setze einfach Auth und waehle ein Modell.

OpenAI

Provider: openai
Auth: OPENAI_API_KEY
Optionale Rotation: OPENAI_API_KEYS, OPENAI_API_KEY_1, OPENAI_API_KEY_2, plus OPENCLAW_LIVE_OPENAI_KEY (einzelner Override)
Beispielmodelle: openai/gpt-5.4, openai/gpt-5.4-pro
CLI: openclaw onboard --auth-choice openai-api-key
Standard-Transport ist auto (WebSocket-first, SSE-Fallback)
Override pro Modell ueber agents.defaults.models["openai/<model>"].params.transport ("sse", "websocket" oder "auto")
OpenAI Responses WebSocket-Warmup ist standardmaessig aktiviert ueber params.openaiWsWarmup (true/false)
OpenAI Priority Processing kann aktiviert werden ueber agents.defaults.models["openai/<model>"].params.serviceTier
OpenAI Fast Mode kann pro Modell aktiviert werden ueber agents.defaults.models["<provider>/<model>"].params.fastMode
openai/gpt-5.3-codex-spark wird in OpenClaw absichtlich unterdrueckt, weil die Live-OpenAI-API es ablehnt; Spark wird als Codex-exklusiv behandelt

{
  agents: { defaults: { model: { primary: "openai/gpt-5.4" } } },
}

Anthropic

Provider: anthropic
Auth: ANTHROPIC_API_KEY oder claude setup-token
Optionale Rotation: ANTHROPIC_API_KEYS, ANTHROPIC_API_KEY_1, ANTHROPIC_API_KEY_2, plus OPENCLAW_LIVE_ANTHROPIC_KEY (einzelner Override)
Beispielmodell: anthropic/claude-opus-4-6
CLI: openclaw onboard --auth-choice token (Setup-Token einfuegen) oder openclaw models auth paste-token --provider anthropic
API-Key-Modelle mit Direktzugriff unterstuetzen den gemeinsamen /fast-Toggle und params.fastMode; OpenClaw bildet das auf Anthropic service_tier ab (auto vs. standard_only)
Policy-Hinweis: Setup-Token-Unterstuetzung ist technische Kompatibilitaet; Anthropic hat in der Vergangenheit einige Subscription-Nutzungen ausserhalb von Claude Code blockiert. Pruefe die aktuellen Anthropic-Bedingungen und entscheide nach deiner Risikoeinschaetzung.
Empfehlung: Anthropic-API-Key-Auth ist der sicherere, empfohlene Weg gegenueber Subscription-Setup-Token-Auth.

{
  agents: { defaults: { model: { primary: "anthropic/claude-opus-4-6" } } },
}

OpenAI Code (Codex)

Provider: openai-codex
Auth: OAuth (ChatGPT)
Beispielmodell: openai-codex/gpt-5.4
CLI: openclaw onboard --auth-choice openai-codex oder openclaw models auth login --provider openai-codex
Standard-Transport ist auto (WebSocket-first, SSE-Fallback)
Override pro Modell ueber agents.defaults.models["openai-codex/<model>"].params.transport ("sse", "websocket" oder "auto")
Teilt denselben /fast-Toggle und params.fastMode-Config wie direkte openai/*
openai-codex/gpt-5.3-codex-spark bleibt verfuegbar, wenn der Codex-OAuth-Katalog es bereitstellt; entitlementabhaengig
Policy-Hinweis: OpenAI Codex OAuth wird explizit fuer externe Tools/Workflows wie OpenClaw unterstuetzt.

{
  agents: { defaults: { model: { primary: "openai-codex/gpt-5.4" } } },
}

OpenCode

Auth: OPENCODE_API_KEY (oder OPENCODE_ZEN_API_KEY)
Zen-Runtime-Provider: opencode
Go-Runtime-Provider: opencode-go
Beispielmodelle: opencode/claude-opus-4-6, opencode-go/kimi-k2.5
CLI: openclaw onboard --auth-choice opencode-zen oder openclaw onboard --auth-choice opencode-go

{
  agents: { defaults: { model: { primary: "opencode/claude-opus-4-6" } } },
}

Google Gemini (API-Schluessel)

Provider: google
Auth: GEMINI_API_KEY
Optionale Rotation: GEMINI_API_KEYS, GEMINI_API_KEY_1, GEMINI_API_KEY_2, GOOGLE_API_KEY Fallback und OPENCLAW_LIVE_GEMINI_KEY (einzelner Override)
Beispielmodelle: google/gemini-3.1-pro-preview, google/gemini-3-flash-preview
Kompatibilitaet: Legacy-OpenClaw-Config mit google/gemini-3.1-flash-preview wird zu google/gemini-3-flash-preview normalisiert
CLI: openclaw onboard --auth-choice gemini-api-key

Google Vertex, Antigravity und Gemini CLI

Provider: google-vertex, google-antigravity, google-gemini-cli
Auth: Vertex nutzt gcloud ADC; Antigravity/Gemini CLI nutzen ihre jeweiligen Auth-Flows
Vorsicht: Antigravity und Gemini CLI OAuth in OpenClaw sind inoffizielle Integrationen. Einige Nutzer haben Google-Account-Einschraenkungen nach Nutzung von Drittanbieter-Clients berichtet. Pruefe die Google-Bedingungen und verwende einen unkritischen Account, wenn du dich dafuer entscheidest.
Antigravity OAuth wird als gebundeltes Plugin ausgeliefert (google-antigravity-auth, standardmaessig deaktiviert).
- Aktivieren: openclaw plugins enable google-antigravity-auth
- Login: openclaw models auth login --provider google-antigravity --set-default
Gemini CLI OAuth wird als gebundeltes Plugin ausgeliefert (google-gemini-cli-auth, standardmaessig deaktiviert).
- Aktivieren: openclaw plugins enable google-gemini-cli-auth
- Login: openclaw models auth login --provider google-gemini-cli --set-default
- Hinweis: Du fuegst keine Client-ID oder kein Secret in openclaw.json ein. Der CLI-Login-Flow speichert Tokens in Auth-Profilen auf dem Gateway-Host.

Z.AI (GLM)

Provider: zai
Auth: ZAI_API_KEY
Beispielmodell: zai/glm-5
CLI: openclaw onboard --auth-choice zai-api-key
- Aliase: z.ai/* und z-ai/* werden zu zai/* normalisiert

Vercel AI Gateway

Provider: vercel-ai-gateway
Auth: AI_GATEWAY_API_KEY
Beispielmodell: vercel-ai-gateway/anthropic/claude-opus-4.6
CLI: openclaw onboard --auth-choice ai-gateway-api-key

Kilo Gateway

Provider: kilocode
Auth: KILOCODE_API_KEY
Beispielmodell: kilocode/anthropic/claude-opus-4.6
CLI: openclaw onboard --kilocode-api-key <key>
Basis-URL: https://api.kilo.ai/api/gateway/
Erweiterter eingebauter Katalog umfasst GLM-5 Free, MiniMax M2.5 Free, GPT-5.2, Gemini 3 Pro Preview, Gemini 3 Flash Preview, Grok Code Fast 1 und Kimi K2.5.

Siehe /providers/kilocode fuer Setup-Details.

Weitere eingebaute Provider

OpenRouter: openrouter (OPENROUTER_API_KEY)
Beispielmodell: openrouter/anthropic/claude-sonnet-4-5
Kilo Gateway: kilocode (KILOCODE_API_KEY)
Beispielmodell: kilocode/anthropic/claude-opus-4.6
xAI: xai (XAI_API_KEY)
Mistral: mistral (MISTRAL_API_KEY)
Beispielmodell: mistral/mistral-large-latest
CLI: openclaw onboard --auth-choice mistral-api-key
Groq: groq (GROQ_API_KEY)
Cerebras: cerebras (CEREBRAS_API_KEY)
- GLM-Modelle auf Cerebras verwenden die IDs zai-glm-4.7 und zai-glm-4.6.
- OpenAI-kompatible Basis-URL: https://api.cerebras.ai/v1.
GitHub Copilot: github-copilot (COPILOT_GITHUB_TOKEN / GH_TOKEN / GITHUB_TOKEN)
Hugging Face Inference: huggingface (HUGGINGFACE_HUB_TOKEN oder HF_TOKEN) — OpenAI-kompatibler Router; Beispielmodell: huggingface/deepseek-ai/DeepSeek-R1; CLI: openclaw onboard --auth-choice huggingface-api-key. Siehe Hugging Face (Inference).

Provider ueber `models.providers` (benutzerdefiniert/Basis-URL)

Verwende models.providers (oder models.json), um benutzerdefinierte Provider oder OpenAI-/Anthropic-kompatible Proxies hinzuzufuegen.

Moonshot AI (Kimi)

Moonshot nutzt OpenAI-kompatible Endpunkte, konfiguriere es also als benutzerdefinierten Provider:

Provider: moonshot
Auth: MOONSHOT_API_KEY
Beispielmodell: moonshot/kimi-k2.5

Kimi K2 Modell-IDs:

{/_ moonshot-kimi-k2-model-refs:start _/ && null}

moonshot/kimi-k2.5
moonshot/kimi-k2-0905-preview
moonshot/kimi-k2-turbo-preview
moonshot/kimi-k2-thinking
moonshot/kimi-k2-thinking-turbo {/_ moonshot-kimi-k2-model-refs:end _/ && null}

{
  agents: {
    defaults: { model: { primary: "moonshot/kimi-k2.5" } },
  },
  models: {
    mode: "merge",
    providers: {
      moonshot: {
        baseUrl: "https://api.moonshot.ai/v1",
        apiKey: "${MOONSHOT_API_KEY}",
        api: "openai-completions",
        models: [{ id: "kimi-k2.5", name: "Kimi K2.5" }],
      },
    },
  },
}

Kimi Coding

Kimi Coding nutzt Moonshot AIs Anthropic-kompatiblen Endpunkt:

Provider: kimi-coding
Auth: KIMI_API_KEY
Beispielmodell: kimi-coding/k2p5

{
  env: { KIMI_API_KEY: "sk-..." },
  agents: {
    defaults: { model: { primary: "kimi-coding/k2p5" } },
  },
}

Qwen OAuth (kostenlose Stufe)

Qwen bietet OAuth-Zugang zu Qwen Coder + Vision ueber einen Device-Code-Flow. Aktiviere das gebundelte Plugin, dann logge dich ein:

openclaw plugins enable qwen-portal-auth
openclaw models auth login --provider qwen-portal --set-default

Model-Refs:

qwen-portal/coder-model
qwen-portal/vision-model

Siehe /providers/qwen fuer Setup-Details und Hinweise.

Volcano Engine (Doubao)

Volcano Engine (Huoshan Yinqing) bietet Zugang zu Doubao und anderen Modellen in China.

Provider: volcengine (Coding: volcengine-plan)
Auth: VOLCANO_ENGINE_API_KEY
Beispielmodell: volcengine/doubao-seed-1-8-251228
CLI: openclaw onboard --auth-choice volcengine-api-key

{
  agents: {
    defaults: { model: { primary: "volcengine/doubao-seed-1-8-251228" } },
  },
}

Verfuegbare Modelle:

volcengine/doubao-seed-1-8-251228 (Doubao Seed 1.8)
volcengine/doubao-seed-code-preview-251028
volcengine/kimi-k2-5-260127 (Kimi K2.5)
volcengine/glm-4-7-251222 (GLM 4.7)
volcengine/deepseek-v3-2-251201 (DeepSeek V3.2 128K)

Coding-Modelle (volcengine-plan):

volcengine-plan/ark-code-latest
volcengine-plan/doubao-seed-code
volcengine-plan/kimi-k2.5
volcengine-plan/kimi-k2-thinking
volcengine-plan/glm-4.7

BytePlus (International)

BytePlus ARK bietet Zugang zu denselben Modellen wie Volcano Engine fuer internationale Nutzer.

Provider: byteplus (Coding: byteplus-plan)
Auth: BYTEPLUS_API_KEY
Beispielmodell: byteplus/seed-1-8-251228
CLI: openclaw onboard --auth-choice byteplus-api-key

{
  agents: {
    defaults: { model: { primary: "byteplus/seed-1-8-251228" } },
  },
}

Verfuegbare Modelle:

byteplus/seed-1-8-251228 (Seed 1.8)
byteplus/kimi-k2-5-260127 (Kimi K2.5)
byteplus/glm-4-7-251222 (GLM 4.7)

Coding-Modelle (byteplus-plan):

byteplus-plan/ark-code-latest
byteplus-plan/doubao-seed-code
byteplus-plan/kimi-k2.5
byteplus-plan/kimi-k2-thinking
byteplus-plan/glm-4.7

Synthetic

Synthetic bietet Anthropic-kompatible Modelle hinter dem synthetic-Provider:

Provider: synthetic
Auth: SYNTHETIC_API_KEY
Beispielmodell: synthetic/hf:MiniMaxAI/MiniMax-M2.5
CLI: openclaw onboard --auth-choice synthetic-api-key

{
  agents: {
    defaults: { model: { primary: "synthetic/hf:MiniMaxAI/MiniMax-M2.5" } },
  },
  models: {
    mode: "merge",
    providers: {
      synthetic: {
        baseUrl: "https://api.synthetic.new/anthropic",
        apiKey: "${SYNTHETIC_API_KEY}",
        api: "anthropic-messages",
        models: [{ id: "hf:MiniMaxAI/MiniMax-M2.5", name: "MiniMax M2.5" }],
      },
    },
  },
}

MiniMax

MiniMax wird ueber models.providers konfiguriert, da es benutzerdefinierte Endpunkte nutzt:

MiniMax (Anthropic-kompatibel): --auth-choice minimax-api
Auth: MINIMAX_API_KEY

Siehe /providers/minimax fuer Setup-Details, Modelloptionen und Config-Snippets.

Ollama

Ollama wird als gebundeltes Provider-Plugin ausgeliefert und nutzt Ollamas native API:

Provider: ollama
Auth: keine erforderlich (lokaler Server)
Beispielmodell: ollama/llama3.3
Installation: https://ollama.com/download

# Ollama installieren, dann ein Modell herunterladen:
ollama pull llama3.3

{
  agents: {
    defaults: { model: { primary: "ollama/llama3.3" } },
  },
}

Ollama wird lokal unter http://127.0.0.1:11434 erkannt, wenn du mit OLLAMA_API_KEY opt-in machst, und das gebundelte Provider-Plugin fuegt Ollama direkt zu openclaw onboard und dem Modell-Picker hinzu. Siehe /providers/ollama fuer Onboarding, Cloud/Local-Modus und benutzerdefinierte Konfiguration.

vLLM

vLLM wird als gebundeltes Provider-Plugin fuer lokale/selbstgehostete OpenAI-kompatible Server ausgeliefert:

Provider: vllm
Auth: Optional (haengt von deinem Server ab)
Standard-Basis-URL: http://127.0.0.1:8000/v1

Um die lokale Auto-Discovery zu aktivieren (jeder Wert funktioniert, wenn dein Server keine Auth erzwingt):

export VLLM_API_KEY="vllm-local"

Dann setze ein Modell (ersetze mit einer der IDs, die /v1/models zurueckgibt):

{
  agents: {
    defaults: { model: { primary: "vllm/your-model-id" } },
  },
}

Siehe /providers/vllm fuer Details.

SGLang

SGLang wird als gebundeltes Provider-Plugin fuer schnelle selbstgehostete OpenAI-kompatible Server ausgeliefert:

Provider: sglang
Auth: Optional (haengt von deinem Server ab)
Standard-Basis-URL: http://127.0.0.1:30000/v1