Venice AI (Venice destacado)

Venice es nuestra configuracion destacada de Venice para inferencia con privacidad primero y acceso anonimizado opcional a modelos propietarios.

Venice AI proporciona inferencia de IA enfocada en la privacidad con soporte para modelos sin censura y acceso a los principales modelos propietarios a traves de su proxy anonimizado. Toda la inferencia es privada por defecto: sin entrenamiento con tus datos, sin registro.

Por que Venice en OpenClaw

Inferencia privada para modelos de codigo abierto (sin registro).
Modelos sin censura cuando los necesites.
Acceso anonimizado a modelos propietarios (Opus/GPT/Gemini) cuando la calidad importa.
Endpoints /v1 compatibles con OpenAI.

Modos de privacidad

Venice ofrece dos niveles de privacidad: entender esto es clave para elegir tu modelo:

Modo	Descripcion	Modelos
Privado	Totalmente privado. Los prompts/respuestas nunca se almacenan ni registran. Efimero.	Llama, Qwen, DeepSeek, Kimi, MiniMax, Venice Uncensored, etc.
Anonimizado	Proxy a traves de Venice con metadatos eliminados. El proveedor subyacente (OpenAI, Anthropic, Google, xAI) ve solicitudes anonimizadas.	Claude, GPT, Gemini, Grok

Caracteristicas

Enfocado en privacidad: Elige entre modos “privado” (totalmente privado) y “anonimizado” (con proxy)
Modelos sin censura: Acceso a modelos sin restricciones de contenido
Acceso a modelos principales: Usa Claude, GPT, Gemini y Grok a traves del proxy anonimizado de Venice
API compatible con OpenAI: Endpoints estandar /v1 para integracion sencilla
Streaming: Soportado en todos los modelos
Llamadas a funciones: Soportado en modelos seleccionados (verifica las capacidades del modelo)
Vision: Soportado en modelos con capacidad de vision
Sin limites de tasa estrictos: Puede aplicarse limitacion por uso justo en uso extremo

Configuracion

1. Obtener clave API

Registrate en venice.ai
Ve a Settings -> API Keys -> Create new key
Copia tu clave API (formato: vapi_xxxxxxxxxxxx)

2. Configurar OpenClaw

Opcion A: Variable de entorno

export VENICE_API_KEY="vapi_xxxxxxxxxxxx"

Opcion B: Configuracion interactiva (recomendada)

openclaw onboard --auth-choice venice-api-key

Esto:

Te pedira tu clave API (o usara la VENICE_API_KEY existente)
Mostrara todos los modelos disponibles de Venice
Te dejara elegir tu modelo predeterminado
Configurara el proveedor automaticamente

Opcion C: No interactivo

openclaw onboard --non-interactive \
  --auth-choice venice-api-key \
  --venice-api-key "vapi_xxxxxxxxxxxx"

3. Verificar la configuracion

openclaw agent --model venice/kimi-k2-5 --message "Hello, are you working?"

Seleccion de modelos

Despues de la configuracion, OpenClaw muestra todos los modelos disponibles de Venice. Elige segun tus necesidades:

Modelo predeterminado: venice/kimi-k2-5 para razonamiento privado solido mas vision.
Opcion de alta capacidad: venice/claude-opus-4-6 para la ruta anonimizada mas potente de Venice.
Privacidad: Elige modelos “privados” para inferencia totalmente privada.
Capacidad: Elige modelos “anonimizados” para acceder a Claude, GPT y Gemini a traves del proxy de Venice.

Cambia tu modelo predeterminado en cualquier momento:

openclaw models set venice/kimi-k2-5
openclaw models set venice/claude-opus-4-6

Lista todos los modelos disponibles:

openclaw models list | grep venice

Configurar mediante `openclaw configure`

Ejecuta openclaw configure
Selecciona Model/auth
Elige Venice AI

Que modelo deberia usar?

Caso de uso	Modelo recomendado	Por que
Chat general (predeterminado)	`kimi-k2-5`	Razonamiento privado solido mas vision
Mejor calidad general	`claude-opus-4-6`	La opcion anonimizada mas potente de Venice
Privacidad + programacion	`qwen3-coder-480b-a35b-instruct`	Modelo de programacion privado con contexto amplio
Vision privada	`kimi-k2-5`	Soporte de vision sin salir del modo privado
Rapido + economico	`qwen3-4b`	Modelo de razonamiento ligero
Tareas privadas complejas	`deepseek-v3.2`	Razonamiento potente, pero sin soporte de herramientas de Venice
Sin censura	`venice-uncensored`	Sin restricciones de contenido

Modelos disponibles (41 en total)

Modelos privados (26) - Totalmente privados, sin registro

ID del modelo	Nombre	Contexto	Caracteristicas
`kimi-k2-5`	Kimi K2.5	256k	Predeterminado, razonamiento, vision
`kimi-k2-thinking`	Kimi K2 Thinking	256k	Razonamiento
`llama-3.3-70b`	Llama 3.3 70B	128k	General
`llama-3.2-3b`	Llama 3.2 3B	128k	General
`hermes-3-llama-3.1-405b`	Hermes 3 Llama 3.1 405B	128k	General, herramientas desactivadas
`qwen3-235b-a22b-thinking-2507`	Qwen3 235B Thinking	128k	Razonamiento
`qwen3-235b-a22b-instruct-2507`	Qwen3 235B Instruct	128k	General
`qwen3-coder-480b-a35b-instruct`	Qwen3 Coder 480B	256k	Programacion
`qwen3-coder-480b-a35b-instruct-turbo`	Qwen3 Coder 480B Turbo	256k	Programacion
`qwen3-5-35b-a3b`	Qwen3.5 35B A3B	256k	Razonamiento, vision
`qwen3-next-80b`	Qwen3 Next 80B	256k	General
`qwen3-vl-235b-a22b`	Qwen3 VL 235B (Vision)	256k	Vision
`qwen3-4b`	Venice Small (Qwen3 4B)	32k	Rapido, razonamiento
`deepseek-v3.2`	DeepSeek V3.2	160k	Razonamiento, herramientas desactivadas
`venice-uncensored`	Venice Uncensored (Dolphin-Mistral)	32k	Sin censura, herramientas desactivadas
`mistral-31-24b`	Venice Medium (Mistral)	128k	Vision
`google-gemma-3-27b-it`	Google Gemma 3 27B Instruct	198k	Vision
`openai-gpt-oss-120b`	OpenAI GPT OSS 120B	128k	General
`nvidia-nemotron-3-nano-30b-a3b`	NVIDIA Nemotron 3 Nano 30B	128k	General
`olafangensan-glm-4.7-flash-heretic`	GLM 4.7 Flash Heretic	128k	Razonamiento
`zai-org-glm-4.6`	GLM 4.6	198k	General
`zai-org-glm-4.7`	GLM 4.7	198k	Razonamiento
`zai-org-glm-4.7-flash`	GLM 4.7 Flash	128k	Razonamiento
`zai-org-glm-5`	GLM 5	198k	Razonamiento
`minimax-m21`	MiniMax M2.1	198k	Razonamiento
`minimax-m25`	MiniMax M2.5	198k	Razonamiento

Modelos anonimizados (15) - A traves del proxy de Venice

ID del modelo	Nombre	Contexto	Caracteristicas
`claude-opus-4-6`	Claude Opus 4.6 (via Venice)	1M	Razonamiento, vision
`claude-opus-4-5`	Claude Opus 4.5 (via Venice)	198k	Razonamiento, vision
`claude-sonnet-4-6`	Claude Sonnet 4.6 (via Venice)	1M	Razonamiento, vision
`claude-sonnet-4-5`	Claude Sonnet 4.5 (via Venice)	198k	Razonamiento, vision
`openai-gpt-54`	GPT-5.4 (via Venice)	1M	Razonamiento, vision
`openai-gpt-53-codex`	GPT-5.3 Codex (via Venice)	400k	Razonamiento, vision, programacion
`openai-gpt-52`	GPT-5.2 (via Venice)	256k	Razonamiento
`openai-gpt-52-codex`	GPT-5.2 Codex (via Venice)	256k	Razonamiento, vision, programacion
`openai-gpt-4o-2024-11-20`	GPT-4o (via Venice)	128k	Vision
`openai-gpt-4o-mini-2024-07-18`	GPT-4o Mini (via Venice)	128k	Vision
`gemini-3-1-pro-preview`	Gemini 3.1 Pro (via Venice)	1M	Razonamiento, vision
`gemini-3-pro-preview`	Gemini 3 Pro (via Venice)	198k	Razonamiento, vision
`gemini-3-flash-preview`	Gemini 3 Flash (via Venice)	256k	Razonamiento, vision
`grok-41-fast`	Grok 4.1 Fast (via Venice)	1M	Razonamiento, vision
`grok-code-fast-1`	Grok Code Fast 1 (via Venice)	256k	Razonamiento, programacion

Descubrimiento de modelos

OpenClaw descubre automaticamente los modelos de la API de Venice cuando VENICE_API_KEY esta establecida. Si la API no es accesible, recurre a un catalogo estatico.

El endpoint /models es publico (no se necesita autenticacion para listar), pero la inferencia requiere una clave API valida.

Soporte de streaming y herramientas

Caracteristica	Soporte
Streaming	Todos los modelos
Llamadas a funciones	La mayoria de los modelos (verifica `supportsFunctionCalling` en la API)
Vision/Imagenes	Modelos marcados con la caracteristica “Vision”
Modo JSON	Soportado via `response_format`

Precios

Venice usa un sistema basado en creditos. Consulta venice.ai/pricing para las tarifas actuales:

Modelos privados: Generalmente menor costo
Modelos anonimizados: Similar al precio directo de la API + una pequena tarifa de Venice

Comparacion: Venice vs API directa

Aspecto	Venice (Anonimizado)	API directa
Privacidad	Metadatos eliminados, anonimizado	Tu cuenta vinculada
Latencia	+10-50ms (proxy)	Directa
Caracteristicas	La mayoria de las caracteristicas soportadas	Todas las caracteristicas
Facturacion	Creditos de Venice	Facturacion del proveedor

Ejemplos de uso

# Usar el modelo privado predeterminado
openclaw agent --model venice/kimi-k2-5 --message "Quick health check"

# Usar Claude Opus a traves de Venice (anonimizado)
openclaw agent --model venice/claude-opus-4-6 --message "Summarize this task"

# Usar modelo sin censura
openclaw agent --model venice/venice-uncensored --message "Draft options"

# Usar modelo de vision con imagen
openclaw agent --model venice/qwen3-vl-235b-a22b --message "Review attached image"

# Usar modelo de programacion
openclaw agent --model venice/qwen3-coder-480b-a35b-instruct --message "Refactor this function"

Solucion de problemas

Clave API no reconocida

echo $VENICE_API_KEY
openclaw models list | grep venice

Asegurate de que la clave comience con vapi_.

Modelo no disponible

El catalogo de modelos de Venice se actualiza dinamicamente. Ejecuta openclaw models list para ver los modelos disponibles actualmente. Algunos modelos pueden estar temporalmente fuera de linea.

Problemas de conexion

La API de Venice esta en https://api.venice.ai/api/v1. Asegurate de que tu red permita conexiones HTTPS.

Ejemplo de archivo de configuracion

{
  env: { VENICE_API_KEY: "vapi_..." },
  agents: { defaults: { model: { primary: "venice/kimi-k2-5" } } },
  models: {
    mode: "merge",
    providers: {
      venice: {
        baseUrl: "https://api.venice.ai/api/v1",
        apiKey: "${VENICE_API_KEY}",
        api: "openai-completions",
        models: [
          {
            id: "kimi-k2-5",
            name: "Kimi K2.5",
            reasoning: true,
            input: ["text", "image"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 256000,
            maxTokens: 65536,
          },
        ],
      },
    },
  },
}