Venice AI (Venice Highlight)

Venice ist unser Highlight-Venice-Setup für Privacy-First-Inferenz mit optionalem anonymisiertem Zugang zu proprietären Modellen.

Venice AI bietet datenschutzorientierte KI-Inferenz mit Unterstützung für unzensierte Modelle und Zugang zu großen proprietären Modellen über ihren anonymisierten Proxy. Alle Inferenz ist standardmäßig privat — kein Training mit deinen Daten, kein Logging.

Warum Venice in OpenClaw

  • Private Inferenz für Open-Source-Modelle (kein Logging).
  • Unzensierte Modelle, wenn du sie brauchst.
  • Anonymisierter Zugang zu proprietären Modellen (Opus/GPT/Gemini), wenn Qualität zählt.
  • OpenAI-kompatible /v1-Endpunkte.

Datenschutz-Modi

Venice bietet zwei Datenschutzstufen — zu verstehen, welche du nutzt, ist der Schlüssel zur Modellwahl:

ModusBeschreibungModelle
PrivateVollständig privat. Prompts/Antworten werden niemals gespeichert oder protokolliert. Kurzlebig.Llama, Qwen, DeepSeek, Kimi, MiniMax, Venice Uncensored usw.
AnonymizedÜber Venice proxied mit entfernten Metadaten. Der zugrundeliegende Anbieter (OpenAI, Anthropic, Google, xAI) sieht anonymisierte Anfragen.Claude, GPT, Gemini, Grok

Features

  • Datenschutzorientiert: Wähle zwischen “private” (vollständig privat) und “anonymized” (proxied)
  • Unzensierte Modelle: Zugang zu Modellen ohne Inhaltsbeschränkungen
  • Zugang zu großen Modellen: Claude, GPT, Gemini und Grok über Venice’ anonymisierten Proxy nutzen
  • OpenAI-kompatible API: Standard-/v1-Endpunkte für einfache Integration
  • Streaming: Auf allen Modellen unterstützt
  • Function Calling: Auf ausgewählten Modellen unterstützt (prüfe die Modellfähigkeiten)
  • Vision: Auf Modellen mit Vision-Fähigkeit unterstützt
  • Keine harten Rate-Limits: Fair-Use-Drosselung kann bei extremer Nutzung greifen

Einrichtung

1. API-Key erhalten

  1. Registriere dich auf venice.ai
  2. Gehe zu Settings -> API Keys -> Create new key
  3. Kopiere deinen API-Key (Format: vapi_xxxxxxxxxxxx)

2. OpenClaw konfigurieren

Option A: Umgebungsvariable

export VENICE_API_KEY="vapi_xxxxxxxxxxxx"

Option B: Interaktive Einrichtung (empfohlen)

openclaw onboard --auth-choice venice-api-key

Dies wird:

  1. Nach deinem API-Key fragen (oder den vorhandenen VENICE_API_KEY verwenden)
  2. Alle verfügbaren Venice-Modelle anzeigen
  3. Dich dein Standardmodell auswählen lassen
  4. Den Provider automatisch konfigurieren

Option C: Nicht-interaktiv

openclaw onboard --non-interactive \
  --auth-choice venice-api-key \
  --venice-api-key "vapi_xxxxxxxxxxxx"

3. Einrichtung überprüfen

openclaw agent --model venice/kimi-k2-5 --message "Hello, are you working?"

Modellauswahl

Nach der Einrichtung zeigt OpenClaw alle verfügbaren Venice-Modelle. Wähle nach deinen Bedürfnissen:

  • Standardmodell: venice/kimi-k2-5 für starkes privates Reasoning plus Vision.
  • Hochleistungsoption: venice/claude-opus-4-6 für den stärksten anonymisierten Venice-Pfad.
  • Datenschutz: Wähle “private” Modelle für vollständig private Inferenz.
  • Leistung: Wähle “anonymized” Modelle, um über Venice’ Proxy auf Claude, GPT, Gemini zuzugreifen.

Standardmodell jederzeit ändern:

openclaw models set venice/kimi-k2-5
openclaw models set venice/claude-opus-4-6

Alle verfügbaren Modelle auflisten:

openclaw models list | grep venice

Per openclaw configure konfigurieren

  1. Führe openclaw configure aus
  2. Wähle Model/auth
  3. Wähle Venice AI

Welches Modell soll ich verwenden?

AnwendungsfallEmpfohlenes ModellBegründung
Allgemeiner Chat (Standard)kimi-k2-5Starkes privates Reasoning plus Vision
Beste Gesamtqualitätclaude-opus-4-6Stärkste anonymisierte Venice-Option
Datenschutz + Codingqwen3-coder-480b-a35b-instructPrivates Coding-Modell mit großem Kontext
Private Visionkimi-k2-5Vision-Unterstützung ohne den privaten Modus zu verlassen
Schnell + günstigqwen3-4bLeichtgewichtiges Reasoning-Modell
Komplexe private Aufgabendeepseek-v3.2Starkes Reasoning, aber kein Venice-Tool-Support
Unzensiertvenice-uncensoredKeine Inhaltsbeschränkungen

Verfügbare Modelle (41 insgesamt)

Private Modelle (26) — Vollständig privat, kein Logging

Model-IDNameKontextFeatures
kimi-k2-5Kimi K2.5256kStandard, Reasoning, Vision
kimi-k2-thinkingKimi K2 Thinking256kReasoning
llama-3.3-70bLlama 3.3 70B128kAllgemein
llama-3.2-3bLlama 3.2 3B128kAllgemein
hermes-3-llama-3.1-405bHermes 3 Llama 3.1 405B128kAllgemein, Tools deaktiviert
qwen3-235b-a22b-thinking-2507Qwen3 235B Thinking128kReasoning
qwen3-235b-a22b-instruct-2507Qwen3 235B Instruct128kAllgemein
qwen3-coder-480b-a35b-instructQwen3 Coder 480B256kCoding
qwen3-coder-480b-a35b-instruct-turboQwen3 Coder 480B Turbo256kCoding
qwen3-5-35b-a3bQwen3.5 35B A3B256kReasoning, Vision
qwen3-next-80bQwen3 Next 80B256kAllgemein
qwen3-vl-235b-a22bQwen3 VL 235B (Vision)256kVision
qwen3-4bVenice Small (Qwen3 4B)32kSchnell, Reasoning
deepseek-v3.2DeepSeek V3.2160kReasoning, Tools deaktiviert
venice-uncensoredVenice Uncensored (Dolphin-Mistral)32kUnzensiert, Tools deaktiviert
mistral-31-24bVenice Medium (Mistral)128kVision
google-gemma-3-27b-itGoogle Gemma 3 27B Instruct198kVision
openai-gpt-oss-120bOpenAI GPT OSS 120B128kAllgemein
nvidia-nemotron-3-nano-30b-a3bNVIDIA Nemotron 3 Nano 30B128kAllgemein
olafangensan-glm-4.7-flash-hereticGLM 4.7 Flash Heretic128kReasoning
zai-org-glm-4.6GLM 4.6198kAllgemein
zai-org-glm-4.7GLM 4.7198kReasoning
zai-org-glm-4.7-flashGLM 4.7 Flash128kReasoning
zai-org-glm-5GLM 5198kReasoning
minimax-m21MiniMax M2.1198kReasoning
minimax-m25MiniMax M2.5198kReasoning

Anonymisierte Modelle (15) — Über Venice Proxy

Model-IDNameKontextFeatures
claude-opus-4-6Claude Opus 4.6 (via Venice)1MReasoning, Vision
claude-opus-4-5Claude Opus 4.5 (via Venice)198kReasoning, Vision
claude-sonnet-4-6Claude Sonnet 4.6 (via Venice)1MReasoning, Vision
claude-sonnet-4-5Claude Sonnet 4.5 (via Venice)198kReasoning, Vision
openai-gpt-54GPT-5.4 (via Venice)1MReasoning, Vision
openai-gpt-53-codexGPT-5.3 Codex (via Venice)400kReasoning, Vision, Coding
openai-gpt-52GPT-5.2 (via Venice)256kReasoning
openai-gpt-52-codexGPT-5.2 Codex (via Venice)256kReasoning, Vision, Coding
openai-gpt-4o-2024-11-20GPT-4o (via Venice)128kVision
openai-gpt-4o-mini-2024-07-18GPT-4o Mini (via Venice)128kVision
gemini-3-1-pro-previewGemini 3.1 Pro (via Venice)1MReasoning, Vision
gemini-3-pro-previewGemini 3 Pro (via Venice)198kReasoning, Vision
gemini-3-flash-previewGemini 3 Flash (via Venice)256kReasoning, Vision
grok-41-fastGrok 4.1 Fast (via Venice)1MReasoning, Vision
grok-code-fast-1Grok Code Fast 1 (via Venice)256kReasoning, Coding

Modellerkennung

OpenClaw erkennt automatisch Modelle von der Venice-API, wenn VENICE_API_KEY gesetzt ist. Falls die API nicht erreichbar ist, fällt es auf einen statischen Katalog zurück.

Der /models-Endpunkt ist öffentlich (keine Authentifizierung zum Auflisten nötig), aber für Inferenz ist ein gültiger API-Key erforderlich.

Streaming & Tool-Unterstützung

FeatureUnterstützung
StreamingAlle Modelle
Function CallingDie meisten Modelle (prüfe supportsFunctionCalling in der API)
Vision/BilderModelle mit “Vision”-Feature
JSON-ModusUnterstützt über response_format

Preise

Venice nutzt ein Credit-basiertes System. Aktuelle Preise findest du unter venice.ai/pricing:

  • Private Modelle: In der Regel günstiger
  • Anonymisierte Modelle: Ähnlich wie direkte API-Preise + kleine Venice-Gebühr

Vergleich: Venice vs. direkte API

AspektVenice (Anonymized)Direkte API
DatenschutzMetadaten entfernt, anonymisiertMit deinem Konto verknüpft
Latenz+10-50ms (Proxy)Direkt
FeaturesDie meisten Features unterstütztAlle Features
AbrechnungVenice-CreditsProvider-Abrechnung

Nutzungsbeispiele

# Das private Standardmodell verwenden
openclaw agent --model venice/kimi-k2-5 --message "Quick health check"

# Claude Opus über Venice verwenden (anonymisiert)
openclaw agent --model venice/claude-opus-4-6 --message "Summarize this task"

# Unzensiertes Modell verwenden
openclaw agent --model venice/venice-uncensored --message "Draft options"

# Vision-Modell mit Bild verwenden
openclaw agent --model venice/qwen3-vl-235b-a22b --message "Review attached image"

# Coding-Modell verwenden
openclaw agent --model venice/qwen3-coder-480b-a35b-instruct --message "Refactor this function"

Fehlerbehebung

API-Key wird nicht erkannt

echo $VENICE_API_KEY
openclaw models list | grep venice

Stelle sicher, dass der Key mit vapi_ beginnt.

Modell nicht verfügbar

Der Venice-Modellkatalog wird dynamisch aktualisiert. Führe openclaw models list aus, um aktuell verfügbare Modelle zu sehen. Einige Modelle können vorübergehend offline sein.

Verbindungsprobleme

Die Venice-API läuft unter https://api.venice.ai/api/v1. Stelle sicher, dass dein Netzwerk HTTPS-Verbindungen erlaubt.

Beispiel-Konfigurationsdatei

{
  env: { VENICE_API_KEY: "vapi_..." },
  agents: { defaults: { model: { primary: "venice/kimi-k2-5" } } },
  models: {
    mode: "merge",
    providers: {
      venice: {
        baseUrl: "https://api.venice.ai/api/v1",
        apiKey: "${VENICE_API_KEY}",
        api: "openai-completions",
        models: [
          {
            id: "kimi-k2-5",
            name: "Kimi K2.5",
            reasoning: true,
            input: ["text", "image"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 256000,
            maxTokens: 65536,
          },
        ],
      },
    },
  },
}