Venice AI (Venice destacado)

Venice es nuestra configuracion destacada de Venice para inferencia con privacidad primero y acceso anonimizado opcional a modelos propietarios.

Venice AI proporciona inferencia de IA enfocada en la privacidad con soporte para modelos sin censura y acceso a los principales modelos propietarios a traves de su proxy anonimizado. Toda la inferencia es privada por defecto: sin entrenamiento con tus datos, sin registro.

Por que Venice en OpenClaw

  • Inferencia privada para modelos de codigo abierto (sin registro).
  • Modelos sin censura cuando los necesites.
  • Acceso anonimizado a modelos propietarios (Opus/GPT/Gemini) cuando la calidad importa.
  • Endpoints /v1 compatibles con OpenAI.

Modos de privacidad

Venice ofrece dos niveles de privacidad: entender esto es clave para elegir tu modelo:

ModoDescripcionModelos
PrivadoTotalmente privado. Los prompts/respuestas nunca se almacenan ni registran. Efimero.Llama, Qwen, DeepSeek, Kimi, MiniMax, Venice Uncensored, etc.
AnonimizadoProxy a traves de Venice con metadatos eliminados. El proveedor subyacente (OpenAI, Anthropic, Google, xAI) ve solicitudes anonimizadas.Claude, GPT, Gemini, Grok

Caracteristicas

  • Enfocado en privacidad: Elige entre modos “privado” (totalmente privado) y “anonimizado” (con proxy)
  • Modelos sin censura: Acceso a modelos sin restricciones de contenido
  • Acceso a modelos principales: Usa Claude, GPT, Gemini y Grok a traves del proxy anonimizado de Venice
  • API compatible con OpenAI: Endpoints estandar /v1 para integracion sencilla
  • Streaming: Soportado en todos los modelos
  • Llamadas a funciones: Soportado en modelos seleccionados (verifica las capacidades del modelo)
  • Vision: Soportado en modelos con capacidad de vision
  • Sin limites de tasa estrictos: Puede aplicarse limitacion por uso justo en uso extremo

Configuracion

1. Obtener clave API

  1. Registrate en venice.ai
  2. Ve a Settings -> API Keys -> Create new key
  3. Copia tu clave API (formato: vapi_xxxxxxxxxxxx)

2. Configurar OpenClaw

Opcion A: Variable de entorno

export VENICE_API_KEY="vapi_xxxxxxxxxxxx"

Opcion B: Configuracion interactiva (recomendada)

openclaw onboard --auth-choice venice-api-key

Esto:

  1. Te pedira tu clave API (o usara la VENICE_API_KEY existente)
  2. Mostrara todos los modelos disponibles de Venice
  3. Te dejara elegir tu modelo predeterminado
  4. Configurara el proveedor automaticamente

Opcion C: No interactivo

openclaw onboard --non-interactive \
  --auth-choice venice-api-key \
  --venice-api-key "vapi_xxxxxxxxxxxx"

3. Verificar la configuracion

openclaw agent --model venice/kimi-k2-5 --message "Hello, are you working?"

Seleccion de modelos

Despues de la configuracion, OpenClaw muestra todos los modelos disponibles de Venice. Elige segun tus necesidades:

  • Modelo predeterminado: venice/kimi-k2-5 para razonamiento privado solido mas vision.
  • Opcion de alta capacidad: venice/claude-opus-4-6 para la ruta anonimizada mas potente de Venice.
  • Privacidad: Elige modelos “privados” para inferencia totalmente privada.
  • Capacidad: Elige modelos “anonimizados” para acceder a Claude, GPT y Gemini a traves del proxy de Venice.

Cambia tu modelo predeterminado en cualquier momento:

openclaw models set venice/kimi-k2-5
openclaw models set venice/claude-opus-4-6

Lista todos los modelos disponibles:

openclaw models list | grep venice

Configurar mediante openclaw configure

  1. Ejecuta openclaw configure
  2. Selecciona Model/auth
  3. Elige Venice AI

Que modelo deberia usar?

Caso de usoModelo recomendadoPor que
Chat general (predeterminado)kimi-k2-5Razonamiento privado solido mas vision
Mejor calidad generalclaude-opus-4-6La opcion anonimizada mas potente de Venice
Privacidad + programacionqwen3-coder-480b-a35b-instructModelo de programacion privado con contexto amplio
Vision privadakimi-k2-5Soporte de vision sin salir del modo privado
Rapido + economicoqwen3-4bModelo de razonamiento ligero
Tareas privadas complejasdeepseek-v3.2Razonamiento potente, pero sin soporte de herramientas de Venice
Sin censuravenice-uncensoredSin restricciones de contenido

Modelos disponibles (41 en total)

Modelos privados (26) - Totalmente privados, sin registro

ID del modeloNombreContextoCaracteristicas
kimi-k2-5Kimi K2.5256kPredeterminado, razonamiento, vision
kimi-k2-thinkingKimi K2 Thinking256kRazonamiento
llama-3.3-70bLlama 3.3 70B128kGeneral
llama-3.2-3bLlama 3.2 3B128kGeneral
hermes-3-llama-3.1-405bHermes 3 Llama 3.1 405B128kGeneral, herramientas desactivadas
qwen3-235b-a22b-thinking-2507Qwen3 235B Thinking128kRazonamiento
qwen3-235b-a22b-instruct-2507Qwen3 235B Instruct128kGeneral
qwen3-coder-480b-a35b-instructQwen3 Coder 480B256kProgramacion
qwen3-coder-480b-a35b-instruct-turboQwen3 Coder 480B Turbo256kProgramacion
qwen3-5-35b-a3bQwen3.5 35B A3B256kRazonamiento, vision
qwen3-next-80bQwen3 Next 80B256kGeneral
qwen3-vl-235b-a22bQwen3 VL 235B (Vision)256kVision
qwen3-4bVenice Small (Qwen3 4B)32kRapido, razonamiento
deepseek-v3.2DeepSeek V3.2160kRazonamiento, herramientas desactivadas
venice-uncensoredVenice Uncensored (Dolphin-Mistral)32kSin censura, herramientas desactivadas
mistral-31-24bVenice Medium (Mistral)128kVision
google-gemma-3-27b-itGoogle Gemma 3 27B Instruct198kVision
openai-gpt-oss-120bOpenAI GPT OSS 120B128kGeneral
nvidia-nemotron-3-nano-30b-a3bNVIDIA Nemotron 3 Nano 30B128kGeneral
olafangensan-glm-4.7-flash-hereticGLM 4.7 Flash Heretic128kRazonamiento
zai-org-glm-4.6GLM 4.6198kGeneral
zai-org-glm-4.7GLM 4.7198kRazonamiento
zai-org-glm-4.7-flashGLM 4.7 Flash128kRazonamiento
zai-org-glm-5GLM 5198kRazonamiento
minimax-m21MiniMax M2.1198kRazonamiento
minimax-m25MiniMax M2.5198kRazonamiento

Modelos anonimizados (15) - A traves del proxy de Venice

ID del modeloNombreContextoCaracteristicas
claude-opus-4-6Claude Opus 4.6 (via Venice)1MRazonamiento, vision
claude-opus-4-5Claude Opus 4.5 (via Venice)198kRazonamiento, vision
claude-sonnet-4-6Claude Sonnet 4.6 (via Venice)1MRazonamiento, vision
claude-sonnet-4-5Claude Sonnet 4.5 (via Venice)198kRazonamiento, vision
openai-gpt-54GPT-5.4 (via Venice)1MRazonamiento, vision
openai-gpt-53-codexGPT-5.3 Codex (via Venice)400kRazonamiento, vision, programacion
openai-gpt-52GPT-5.2 (via Venice)256kRazonamiento
openai-gpt-52-codexGPT-5.2 Codex (via Venice)256kRazonamiento, vision, programacion
openai-gpt-4o-2024-11-20GPT-4o (via Venice)128kVision
openai-gpt-4o-mini-2024-07-18GPT-4o Mini (via Venice)128kVision
gemini-3-1-pro-previewGemini 3.1 Pro (via Venice)1MRazonamiento, vision
gemini-3-pro-previewGemini 3 Pro (via Venice)198kRazonamiento, vision
gemini-3-flash-previewGemini 3 Flash (via Venice)256kRazonamiento, vision
grok-41-fastGrok 4.1 Fast (via Venice)1MRazonamiento, vision
grok-code-fast-1Grok Code Fast 1 (via Venice)256kRazonamiento, programacion

Descubrimiento de modelos

OpenClaw descubre automaticamente los modelos de la API de Venice cuando VENICE_API_KEY esta establecida. Si la API no es accesible, recurre a un catalogo estatico.

El endpoint /models es publico (no se necesita autenticacion para listar), pero la inferencia requiere una clave API valida.

Soporte de streaming y herramientas

CaracteristicaSoporte
StreamingTodos los modelos
Llamadas a funcionesLa mayoria de los modelos (verifica supportsFunctionCalling en la API)
Vision/ImagenesModelos marcados con la caracteristica “Vision”
Modo JSONSoportado via response_format

Precios

Venice usa un sistema basado en creditos. Consulta venice.ai/pricing para las tarifas actuales:

  • Modelos privados: Generalmente menor costo
  • Modelos anonimizados: Similar al precio directo de la API + una pequena tarifa de Venice

Comparacion: Venice vs API directa

AspectoVenice (Anonimizado)API directa
PrivacidadMetadatos eliminados, anonimizadoTu cuenta vinculada
Latencia+10-50ms (proxy)Directa
CaracteristicasLa mayoria de las caracteristicas soportadasTodas las caracteristicas
FacturacionCreditos de VeniceFacturacion del proveedor

Ejemplos de uso

# Usar el modelo privado predeterminado
openclaw agent --model venice/kimi-k2-5 --message "Quick health check"

# Usar Claude Opus a traves de Venice (anonimizado)
openclaw agent --model venice/claude-opus-4-6 --message "Summarize this task"

# Usar modelo sin censura
openclaw agent --model venice/venice-uncensored --message "Draft options"

# Usar modelo de vision con imagen
openclaw agent --model venice/qwen3-vl-235b-a22b --message "Review attached image"

# Usar modelo de programacion
openclaw agent --model venice/qwen3-coder-480b-a35b-instruct --message "Refactor this function"

Solucion de problemas

Clave API no reconocida

echo $VENICE_API_KEY
openclaw models list | grep venice

Asegurate de que la clave comience con vapi_.

Modelo no disponible

El catalogo de modelos de Venice se actualiza dinamicamente. Ejecuta openclaw models list para ver los modelos disponibles actualmente. Algunos modelos pueden estar temporalmente fuera de linea.

Problemas de conexion

La API de Venice esta en https://api.venice.ai/api/v1. Asegurate de que tu red permita conexiones HTTPS.

Ejemplo de archivo de configuracion

{
  env: { VENICE_API_KEY: "vapi_..." },
  agents: { defaults: { model: { primary: "venice/kimi-k2-5" } } },
  models: {
    mode: "merge",
    providers: {
      venice: {
        baseUrl: "https://api.venice.ai/api/v1",
        apiKey: "${VENICE_API_KEY}",
        api: "openai-completions",
        models: [
          {
            id: "kimi-k2-5",
            name: "Kimi K2.5",
            reasoning: true,
            input: ["text", "image"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 256000,
            maxTokens: 65536,
          },
        ],
      },
    },
  },
}

Enlaces