Modell-Provider

Diese Seite behandelt LLM/Modell-Provider (nicht Chat-Kanaele wie WhatsApp/Telegram). Fuer Modellauswahlregeln siehe /concepts/models.

Kurzregeln

  • Model-Refs verwenden provider/model (Beispiel: opencode/claude-opus-4-6).
  • Wenn du agents.defaults.models setzt, wird es zur Allowlist.
  • CLI-Helfer: openclaw onboard, openclaw models list, openclaw models set <provider/model>.

API-Schluessel-Rotation

  • Unterstuetzt generische Provider-Rotation fuer ausgewaehlte Provider.
  • Konfiguriere mehrere Schluessel ueber:
    • OPENCLAW_LIVE_<PROVIDER>_KEY (einzelner Live-Override, hoechste Prioritaet)
    • <PROVIDER>_API_KEYS (komma- oder semikolongetrennte Liste)
    • <PROVIDER>_API_KEY (primaerer Schluessel)
    • <PROVIDER>_API_KEY_* (nummerierte Liste, z.B. <PROVIDER>_API_KEY_1)
  • Fuer Google-Provider wird GOOGLE_API_KEY ebenfalls als Fallback einbezogen.
  • Die Schluesselauswahl bewahrt die Prioritaet und dedupliziert Werte.
  • Requests werden nur bei Rate-Limit-Antworten (zum Beispiel 429, rate_limit, quota, resource exhausted) mit dem naechsten Schluessel wiederholt.
  • Nicht-Rate-Limit-Fehler schlagen sofort fehl; keine Schluesselrotation wird versucht.
  • Wenn alle Kandidaten-Schluessel fehlschlagen, wird der letzte Fehler zurueckgegeben.

Eingebaute Provider (pi-ai-Katalog)

OpenClaw wird mit dem pi-ai-Katalog ausgeliefert. Diese Provider brauchen keine models.providers-Konfiguration; setze einfach Auth und waehle ein Modell.

OpenAI

  • Provider: openai
  • Auth: OPENAI_API_KEY
  • Optionale Rotation: OPENAI_API_KEYS, OPENAI_API_KEY_1, OPENAI_API_KEY_2, plus OPENCLAW_LIVE_OPENAI_KEY (einzelner Override)
  • Beispielmodelle: openai/gpt-5.4, openai/gpt-5.4-pro
  • CLI: openclaw onboard --auth-choice openai-api-key
  • Standard-Transport ist auto (WebSocket-first, SSE-Fallback)
  • Override pro Modell ueber agents.defaults.models["openai/<model>"].params.transport ("sse", "websocket" oder "auto")
  • OpenAI Responses WebSocket-Warmup ist standardmaessig aktiviert ueber params.openaiWsWarmup (true/false)
  • OpenAI Priority Processing kann aktiviert werden ueber agents.defaults.models["openai/<model>"].params.serviceTier
  • OpenAI Fast Mode kann pro Modell aktiviert werden ueber agents.defaults.models["<provider>/<model>"].params.fastMode
  • openai/gpt-5.3-codex-spark wird in OpenClaw absichtlich unterdrueckt, weil die Live-OpenAI-API es ablehnt; Spark wird als Codex-exklusiv behandelt
{
  agents: { defaults: { model: { primary: "openai/gpt-5.4" } } },
}

Anthropic

  • Provider: anthropic
  • Auth: ANTHROPIC_API_KEY oder claude setup-token
  • Optionale Rotation: ANTHROPIC_API_KEYS, ANTHROPIC_API_KEY_1, ANTHROPIC_API_KEY_2, plus OPENCLAW_LIVE_ANTHROPIC_KEY (einzelner Override)
  • Beispielmodell: anthropic/claude-opus-4-6
  • CLI: openclaw onboard --auth-choice token (Setup-Token einfuegen) oder openclaw models auth paste-token --provider anthropic
  • API-Key-Modelle mit Direktzugriff unterstuetzen den gemeinsamen /fast-Toggle und params.fastMode; OpenClaw bildet das auf Anthropic service_tier ab (auto vs. standard_only)
  • Policy-Hinweis: Setup-Token-Unterstuetzung ist technische Kompatibilitaet; Anthropic hat in der Vergangenheit einige Subscription-Nutzungen ausserhalb von Claude Code blockiert. Pruefe die aktuellen Anthropic-Bedingungen und entscheide nach deiner Risikoeinschaetzung.
  • Empfehlung: Anthropic-API-Key-Auth ist der sicherere, empfohlene Weg gegenueber Subscription-Setup-Token-Auth.
{
  agents: { defaults: { model: { primary: "anthropic/claude-opus-4-6" } } },
}

OpenAI Code (Codex)

  • Provider: openai-codex
  • Auth: OAuth (ChatGPT)
  • Beispielmodell: openai-codex/gpt-5.4
  • CLI: openclaw onboard --auth-choice openai-codex oder openclaw models auth login --provider openai-codex
  • Standard-Transport ist auto (WebSocket-first, SSE-Fallback)
  • Override pro Modell ueber agents.defaults.models["openai-codex/<model>"].params.transport ("sse", "websocket" oder "auto")
  • Teilt denselben /fast-Toggle und params.fastMode-Config wie direkte openai/*
  • openai-codex/gpt-5.3-codex-spark bleibt verfuegbar, wenn der Codex-OAuth-Katalog es bereitstellt; entitlementabhaengig
  • Policy-Hinweis: OpenAI Codex OAuth wird explizit fuer externe Tools/Workflows wie OpenClaw unterstuetzt.
{
  agents: { defaults: { model: { primary: "openai-codex/gpt-5.4" } } },
}

OpenCode

  • Auth: OPENCODE_API_KEY (oder OPENCODE_ZEN_API_KEY)
  • Zen-Runtime-Provider: opencode
  • Go-Runtime-Provider: opencode-go
  • Beispielmodelle: opencode/claude-opus-4-6, opencode-go/kimi-k2.5
  • CLI: openclaw onboard --auth-choice opencode-zen oder openclaw onboard --auth-choice opencode-go
{
  agents: { defaults: { model: { primary: "opencode/claude-opus-4-6" } } },
}

Google Gemini (API-Schluessel)

  • Provider: google
  • Auth: GEMINI_API_KEY
  • Optionale Rotation: GEMINI_API_KEYS, GEMINI_API_KEY_1, GEMINI_API_KEY_2, GOOGLE_API_KEY Fallback und OPENCLAW_LIVE_GEMINI_KEY (einzelner Override)
  • Beispielmodelle: google/gemini-3.1-pro-preview, google/gemini-3-flash-preview
  • Kompatibilitaet: Legacy-OpenClaw-Config mit google/gemini-3.1-flash-preview wird zu google/gemini-3-flash-preview normalisiert
  • CLI: openclaw onboard --auth-choice gemini-api-key

Google Vertex, Antigravity und Gemini CLI

  • Provider: google-vertex, google-antigravity, google-gemini-cli
  • Auth: Vertex nutzt gcloud ADC; Antigravity/Gemini CLI nutzen ihre jeweiligen Auth-Flows
  • Vorsicht: Antigravity und Gemini CLI OAuth in OpenClaw sind inoffizielle Integrationen. Einige Nutzer haben Google-Account-Einschraenkungen nach Nutzung von Drittanbieter-Clients berichtet. Pruefe die Google-Bedingungen und verwende einen unkritischen Account, wenn du dich dafuer entscheidest.
  • Antigravity OAuth wird als gebundeltes Plugin ausgeliefert (google-antigravity-auth, standardmaessig deaktiviert).
    • Aktivieren: openclaw plugins enable google-antigravity-auth
    • Login: openclaw models auth login --provider google-antigravity --set-default
  • Gemini CLI OAuth wird als gebundeltes Plugin ausgeliefert (google-gemini-cli-auth, standardmaessig deaktiviert).
    • Aktivieren: openclaw plugins enable google-gemini-cli-auth
    • Login: openclaw models auth login --provider google-gemini-cli --set-default
    • Hinweis: Du fuegst keine Client-ID oder kein Secret in openclaw.json ein. Der CLI-Login-Flow speichert Tokens in Auth-Profilen auf dem Gateway-Host.

Z.AI (GLM)

  • Provider: zai
  • Auth: ZAI_API_KEY
  • Beispielmodell: zai/glm-5
  • CLI: openclaw onboard --auth-choice zai-api-key
    • Aliase: z.ai/* und z-ai/* werden zu zai/* normalisiert

Vercel AI Gateway

  • Provider: vercel-ai-gateway
  • Auth: AI_GATEWAY_API_KEY
  • Beispielmodell: vercel-ai-gateway/anthropic/claude-opus-4.6
  • CLI: openclaw onboard --auth-choice ai-gateway-api-key

Kilo Gateway

  • Provider: kilocode
  • Auth: KILOCODE_API_KEY
  • Beispielmodell: kilocode/anthropic/claude-opus-4.6
  • CLI: openclaw onboard --kilocode-api-key <key>
  • Basis-URL: https://api.kilo.ai/api/gateway/
  • Erweiterter eingebauter Katalog umfasst GLM-5 Free, MiniMax M2.5 Free, GPT-5.2, Gemini 3 Pro Preview, Gemini 3 Flash Preview, Grok Code Fast 1 und Kimi K2.5.

Siehe /providers/kilocode fuer Setup-Details.

Weitere eingebaute Provider

  • OpenRouter: openrouter (OPENROUTER_API_KEY)
  • Beispielmodell: openrouter/anthropic/claude-sonnet-4-5
  • Kilo Gateway: kilocode (KILOCODE_API_KEY)
  • Beispielmodell: kilocode/anthropic/claude-opus-4.6
  • xAI: xai (XAI_API_KEY)
  • Mistral: mistral (MISTRAL_API_KEY)
  • Beispielmodell: mistral/mistral-large-latest
  • CLI: openclaw onboard --auth-choice mistral-api-key
  • Groq: groq (GROQ_API_KEY)
  • Cerebras: cerebras (CEREBRAS_API_KEY)
    • GLM-Modelle auf Cerebras verwenden die IDs zai-glm-4.7 und zai-glm-4.6.
    • OpenAI-kompatible Basis-URL: https://api.cerebras.ai/v1.
  • GitHub Copilot: github-copilot (COPILOT_GITHUB_TOKEN / GH_TOKEN / GITHUB_TOKEN)
  • Hugging Face Inference: huggingface (HUGGINGFACE_HUB_TOKEN oder HF_TOKEN) — OpenAI-kompatibler Router; Beispielmodell: huggingface/deepseek-ai/DeepSeek-R1; CLI: openclaw onboard --auth-choice huggingface-api-key. Siehe Hugging Face (Inference).

Provider ueber models.providers (benutzerdefiniert/Basis-URL)

Verwende models.providers (oder models.json), um benutzerdefinierte Provider oder OpenAI-/Anthropic-kompatible Proxies hinzuzufuegen.

Moonshot AI (Kimi)

Moonshot nutzt OpenAI-kompatible Endpunkte, konfiguriere es also als benutzerdefinierten Provider:

  • Provider: moonshot
  • Auth: MOONSHOT_API_KEY
  • Beispielmodell: moonshot/kimi-k2.5

Kimi K2 Modell-IDs:

{/_ moonshot-kimi-k2-model-refs:start _/ && null}

  • moonshot/kimi-k2.5
  • moonshot/kimi-k2-0905-preview
  • moonshot/kimi-k2-turbo-preview
  • moonshot/kimi-k2-thinking
  • moonshot/kimi-k2-thinking-turbo {/_ moonshot-kimi-k2-model-refs:end _/ && null}
{
  agents: {
    defaults: { model: { primary: "moonshot/kimi-k2.5" } },
  },
  models: {
    mode: "merge",
    providers: {
      moonshot: {
        baseUrl: "https://api.moonshot.ai/v1",
        apiKey: "${MOONSHOT_API_KEY}",
        api: "openai-completions",
        models: [{ id: "kimi-k2.5", name: "Kimi K2.5" }],
      },
    },
  },
}

Kimi Coding

Kimi Coding nutzt Moonshot AIs Anthropic-kompatiblen Endpunkt:

  • Provider: kimi-coding
  • Auth: KIMI_API_KEY
  • Beispielmodell: kimi-coding/k2p5
{
  env: { KIMI_API_KEY: "sk-..." },
  agents: {
    defaults: { model: { primary: "kimi-coding/k2p5" } },
  },
}

Qwen OAuth (kostenlose Stufe)

Qwen bietet OAuth-Zugang zu Qwen Coder + Vision ueber einen Device-Code-Flow. Aktiviere das gebundelte Plugin, dann logge dich ein:

openclaw plugins enable qwen-portal-auth
openclaw models auth login --provider qwen-portal --set-default

Model-Refs:

  • qwen-portal/coder-model
  • qwen-portal/vision-model

Siehe /providers/qwen fuer Setup-Details und Hinweise.

Volcano Engine (Doubao)

Volcano Engine (Huoshan Yinqing) bietet Zugang zu Doubao und anderen Modellen in China.

  • Provider: volcengine (Coding: volcengine-plan)
  • Auth: VOLCANO_ENGINE_API_KEY
  • Beispielmodell: volcengine/doubao-seed-1-8-251228
  • CLI: openclaw onboard --auth-choice volcengine-api-key
{
  agents: {
    defaults: { model: { primary: "volcengine/doubao-seed-1-8-251228" } },
  },
}

Verfuegbare Modelle:

  • volcengine/doubao-seed-1-8-251228 (Doubao Seed 1.8)
  • volcengine/doubao-seed-code-preview-251028
  • volcengine/kimi-k2-5-260127 (Kimi K2.5)
  • volcengine/glm-4-7-251222 (GLM 4.7)
  • volcengine/deepseek-v3-2-251201 (DeepSeek V3.2 128K)

Coding-Modelle (volcengine-plan):

  • volcengine-plan/ark-code-latest
  • volcengine-plan/doubao-seed-code
  • volcengine-plan/kimi-k2.5
  • volcengine-plan/kimi-k2-thinking
  • volcengine-plan/glm-4.7

BytePlus (International)

BytePlus ARK bietet Zugang zu denselben Modellen wie Volcano Engine fuer internationale Nutzer.

  • Provider: byteplus (Coding: byteplus-plan)
  • Auth: BYTEPLUS_API_KEY
  • Beispielmodell: byteplus/seed-1-8-251228
  • CLI: openclaw onboard --auth-choice byteplus-api-key
{
  agents: {
    defaults: { model: { primary: "byteplus/seed-1-8-251228" } },
  },
}

Verfuegbare Modelle:

  • byteplus/seed-1-8-251228 (Seed 1.8)
  • byteplus/kimi-k2-5-260127 (Kimi K2.5)
  • byteplus/glm-4-7-251222 (GLM 4.7)

Coding-Modelle (byteplus-plan):

  • byteplus-plan/ark-code-latest
  • byteplus-plan/doubao-seed-code
  • byteplus-plan/kimi-k2.5
  • byteplus-plan/kimi-k2-thinking
  • byteplus-plan/glm-4.7

Synthetic

Synthetic bietet Anthropic-kompatible Modelle hinter dem synthetic-Provider:

  • Provider: synthetic
  • Auth: SYNTHETIC_API_KEY
  • Beispielmodell: synthetic/hf:MiniMaxAI/MiniMax-M2.5
  • CLI: openclaw onboard --auth-choice synthetic-api-key
{
  agents: {
    defaults: { model: { primary: "synthetic/hf:MiniMaxAI/MiniMax-M2.5" } },
  },
  models: {
    mode: "merge",
    providers: {
      synthetic: {
        baseUrl: "https://api.synthetic.new/anthropic",
        apiKey: "${SYNTHETIC_API_KEY}",
        api: "anthropic-messages",
        models: [{ id: "hf:MiniMaxAI/MiniMax-M2.5", name: "MiniMax M2.5" }],
      },
    },
  },
}

MiniMax

MiniMax wird ueber models.providers konfiguriert, da es benutzerdefinierte Endpunkte nutzt:

  • MiniMax (Anthropic-kompatibel): --auth-choice minimax-api
  • Auth: MINIMAX_API_KEY

Siehe /providers/minimax fuer Setup-Details, Modelloptionen und Config-Snippets.

Ollama

Ollama wird als gebundeltes Provider-Plugin ausgeliefert und nutzt Ollamas native API:

# Ollama installieren, dann ein Modell herunterladen:
ollama pull llama3.3
{
  agents: {
    defaults: { model: { primary: "ollama/llama3.3" } },
  },
}

Ollama wird lokal unter http://127.0.0.1:11434 erkannt, wenn du mit OLLAMA_API_KEY opt-in machst, und das gebundelte Provider-Plugin fuegt Ollama direkt zu openclaw onboard und dem Modell-Picker hinzu. Siehe /providers/ollama fuer Onboarding, Cloud/Local-Modus und benutzerdefinierte Konfiguration.

vLLM

vLLM wird als gebundeltes Provider-Plugin fuer lokale/selbstgehostete OpenAI-kompatible Server ausgeliefert:

  • Provider: vllm
  • Auth: Optional (haengt von deinem Server ab)
  • Standard-Basis-URL: http://127.0.0.1:8000/v1

Um die lokale Auto-Discovery zu aktivieren (jeder Wert funktioniert, wenn dein Server keine Auth erzwingt):

export VLLM_API_KEY="vllm-local"

Dann setze ein Modell (ersetze mit einer der IDs, die /v1/models zurueckgibt):

{
  agents: {
    defaults: { model: { primary: "vllm/your-model-id" } },
  },
}

Siehe /providers/vllm fuer Details.

SGLang

SGLang wird als gebundeltes Provider-Plugin fuer schnelle selbstgehostete OpenAI-kompatible Server ausgeliefert:

  • Provider: sglang
  • Auth: Optional (haengt von deinem Server ab)
  • Standard-Basis-URL: http://127.0.0.1:30000/v1

Um die lokale Auto-Discovery zu aktivieren (jeder Wert funktioniert, wenn dein Server keine Auth erzwingt):

export SGLANG_API_KEY="sglang-local"

Dann setze ein Modell (ersetze mit einer der IDs, die /v1/models zurueckgibt):

{
  agents: {
    defaults: { model: { primary: "sglang/your-model-id" } },
  },
}

Siehe /providers/sglang fuer Details.

Lokale Proxies (LM Studio, vLLM, LiteLLM usw.)

Beispiel (OpenAI-kompatibel):

{
  agents: {
    defaults: {
      model: { primary: "lmstudio/minimax-m2.5-gs32" },
      models: { "lmstudio/minimax-m2.5-gs32": { alias: "Minimax" } },
    },
  },
  models: {
    providers: {
      lmstudio: {
        baseUrl: "http://localhost:1234/v1",
        apiKey: "LMSTUDIO_KEY",
        api: "openai-completions",
        models: [
          {
            id: "minimax-m2.5-gs32",
            name: "MiniMax M2.5",
            reasoning: false,
            input: ["text"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 200000,
            maxTokens: 8192,
          },
        ],
      },
    },
  },
}

Hinweise:

  • Fuer benutzerdefinierte Provider sind reasoning, input, cost, contextWindow und maxTokens optional. Wenn nicht angegeben, setzt OpenClaw folgende Standards:
    • reasoning: false
    • input: ["text"]
    • cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 }
    • contextWindow: 200000
    • maxTokens: 8192
  • Empfohlen: Setze explizite Werte, die zu deinen Proxy-/Modell-Limits passen.
  • Fuer api: "openai-completions" auf nicht-nativen Endpunkten (jede nicht-leere baseUrl, deren Host nicht api.openai.com ist), erzwingt OpenClaw compat.supportsDeveloperRole: false, um Provider-400-Fehler fuer nicht unterstuetzte developer-Rollen zu vermeiden.
  • Wenn baseUrl leer/nicht angegeben ist, behaelt OpenClaw das Standard-OpenAI-Verhalten bei (das auf api.openai.com aufloest).
  • Zur Sicherheit wird ein explizites compat.supportsDeveloperRole: true auf nicht-nativen openai-completions-Endpunkten trotzdem ueberschrieben.

CLI-Beispiele

openclaw onboard --auth-choice opencode-zen
openclaw models set opencode/claude-opus-4-6
openclaw models list

Siehe auch: /gateway/configuration fuer vollstaendige Konfigurationsbeispiele.