Venice AI (Venice destacado)
Venice es nuestra configuracion destacada de Venice para inferencia con privacidad primero y acceso anonimizado opcional a modelos propietarios.
Venice AI proporciona inferencia de IA enfocada en la privacidad con soporte para modelos sin censura y acceso a los principales modelos propietarios a traves de su proxy anonimizado. Toda la inferencia es privada por defecto: sin entrenamiento con tus datos, sin registro.
Por que Venice en OpenClaw
- Inferencia privada para modelos de codigo abierto (sin registro).
- Modelos sin censura cuando los necesites.
- Acceso anonimizado a modelos propietarios (Opus/GPT/Gemini) cuando la calidad importa.
- Endpoints
/v1compatibles con OpenAI.
Modos de privacidad
Venice ofrece dos niveles de privacidad: entender esto es clave para elegir tu modelo:
| Modo | Descripcion | Modelos |
|---|---|---|
| Privado | Totalmente privado. Los prompts/respuestas nunca se almacenan ni registran. Efimero. | Llama, Qwen, DeepSeek, Kimi, MiniMax, Venice Uncensored, etc. |
| Anonimizado | Proxy a traves de Venice con metadatos eliminados. El proveedor subyacente (OpenAI, Anthropic, Google, xAI) ve solicitudes anonimizadas. | Claude, GPT, Gemini, Grok |
Caracteristicas
- Enfocado en privacidad: Elige entre modos “privado” (totalmente privado) y “anonimizado” (con proxy)
- Modelos sin censura: Acceso a modelos sin restricciones de contenido
- Acceso a modelos principales: Usa Claude, GPT, Gemini y Grok a traves del proxy anonimizado de Venice
- API compatible con OpenAI: Endpoints estandar
/v1para integracion sencilla - Streaming: Soportado en todos los modelos
- Llamadas a funciones: Soportado en modelos seleccionados (verifica las capacidades del modelo)
- Vision: Soportado en modelos con capacidad de vision
- Sin limites de tasa estrictos: Puede aplicarse limitacion por uso justo en uso extremo
Configuracion
1. Obtener clave API
- Registrate en venice.ai
- Ve a Settings -> API Keys -> Create new key
- Copia tu clave API (formato:
vapi_xxxxxxxxxxxx)
2. Configurar OpenClaw
Opcion A: Variable de entorno
export VENICE_API_KEY="vapi_xxxxxxxxxxxx"
Opcion B: Configuracion interactiva (recomendada)
openclaw onboard --auth-choice venice-api-key
Esto:
- Te pedira tu clave API (o usara la
VENICE_API_KEYexistente) - Mostrara todos los modelos disponibles de Venice
- Te dejara elegir tu modelo predeterminado
- Configurara el proveedor automaticamente
Opcion C: No interactivo
openclaw onboard --non-interactive \
--auth-choice venice-api-key \
--venice-api-key "vapi_xxxxxxxxxxxx"
3. Verificar la configuracion
openclaw agent --model venice/kimi-k2-5 --message "Hello, are you working?"
Seleccion de modelos
Despues de la configuracion, OpenClaw muestra todos los modelos disponibles de Venice. Elige segun tus necesidades:
- Modelo predeterminado:
venice/kimi-k2-5para razonamiento privado solido mas vision. - Opcion de alta capacidad:
venice/claude-opus-4-6para la ruta anonimizada mas potente de Venice. - Privacidad: Elige modelos “privados” para inferencia totalmente privada.
- Capacidad: Elige modelos “anonimizados” para acceder a Claude, GPT y Gemini a traves del proxy de Venice.
Cambia tu modelo predeterminado en cualquier momento:
openclaw models set venice/kimi-k2-5
openclaw models set venice/claude-opus-4-6
Lista todos los modelos disponibles:
openclaw models list | grep venice
Configurar mediante openclaw configure
- Ejecuta
openclaw configure - Selecciona Model/auth
- Elige Venice AI
Que modelo deberia usar?
| Caso de uso | Modelo recomendado | Por que |
|---|---|---|
| Chat general (predeterminado) | kimi-k2-5 | Razonamiento privado solido mas vision |
| Mejor calidad general | claude-opus-4-6 | La opcion anonimizada mas potente de Venice |
| Privacidad + programacion | qwen3-coder-480b-a35b-instruct | Modelo de programacion privado con contexto amplio |
| Vision privada | kimi-k2-5 | Soporte de vision sin salir del modo privado |
| Rapido + economico | qwen3-4b | Modelo de razonamiento ligero |
| Tareas privadas complejas | deepseek-v3.2 | Razonamiento potente, pero sin soporte de herramientas de Venice |
| Sin censura | venice-uncensored | Sin restricciones de contenido |
Modelos disponibles (41 en total)
Modelos privados (26) - Totalmente privados, sin registro
| ID del modelo | Nombre | Contexto | Caracteristicas |
|---|---|---|---|
kimi-k2-5 | Kimi K2.5 | 256k | Predeterminado, razonamiento, vision |
kimi-k2-thinking | Kimi K2 Thinking | 256k | Razonamiento |
llama-3.3-70b | Llama 3.3 70B | 128k | General |
llama-3.2-3b | Llama 3.2 3B | 128k | General |
hermes-3-llama-3.1-405b | Hermes 3 Llama 3.1 405B | 128k | General, herramientas desactivadas |
qwen3-235b-a22b-thinking-2507 | Qwen3 235B Thinking | 128k | Razonamiento |
qwen3-235b-a22b-instruct-2507 | Qwen3 235B Instruct | 128k | General |
qwen3-coder-480b-a35b-instruct | Qwen3 Coder 480B | 256k | Programacion |
qwen3-coder-480b-a35b-instruct-turbo | Qwen3 Coder 480B Turbo | 256k | Programacion |
qwen3-5-35b-a3b | Qwen3.5 35B A3B | 256k | Razonamiento, vision |
qwen3-next-80b | Qwen3 Next 80B | 256k | General |
qwen3-vl-235b-a22b | Qwen3 VL 235B (Vision) | 256k | Vision |
qwen3-4b | Venice Small (Qwen3 4B) | 32k | Rapido, razonamiento |
deepseek-v3.2 | DeepSeek V3.2 | 160k | Razonamiento, herramientas desactivadas |
venice-uncensored | Venice Uncensored (Dolphin-Mistral) | 32k | Sin censura, herramientas desactivadas |
mistral-31-24b | Venice Medium (Mistral) | 128k | Vision |
google-gemma-3-27b-it | Google Gemma 3 27B Instruct | 198k | Vision |
openai-gpt-oss-120b | OpenAI GPT OSS 120B | 128k | General |
nvidia-nemotron-3-nano-30b-a3b | NVIDIA Nemotron 3 Nano 30B | 128k | General |
olafangensan-glm-4.7-flash-heretic | GLM 4.7 Flash Heretic | 128k | Razonamiento |
zai-org-glm-4.6 | GLM 4.6 | 198k | General |
zai-org-glm-4.7 | GLM 4.7 | 198k | Razonamiento |
zai-org-glm-4.7-flash | GLM 4.7 Flash | 128k | Razonamiento |
zai-org-glm-5 | GLM 5 | 198k | Razonamiento |
minimax-m21 | MiniMax M2.1 | 198k | Razonamiento |
minimax-m25 | MiniMax M2.5 | 198k | Razonamiento |
Modelos anonimizados (15) - A traves del proxy de Venice
| ID del modelo | Nombre | Contexto | Caracteristicas |
|---|---|---|---|
claude-opus-4-6 | Claude Opus 4.6 (via Venice) | 1M | Razonamiento, vision |
claude-opus-4-5 | Claude Opus 4.5 (via Venice) | 198k | Razonamiento, vision |
claude-sonnet-4-6 | Claude Sonnet 4.6 (via Venice) | 1M | Razonamiento, vision |
claude-sonnet-4-5 | Claude Sonnet 4.5 (via Venice) | 198k | Razonamiento, vision |
openai-gpt-54 | GPT-5.4 (via Venice) | 1M | Razonamiento, vision |
openai-gpt-53-codex | GPT-5.3 Codex (via Venice) | 400k | Razonamiento, vision, programacion |
openai-gpt-52 | GPT-5.2 (via Venice) | 256k | Razonamiento |
openai-gpt-52-codex | GPT-5.2 Codex (via Venice) | 256k | Razonamiento, vision, programacion |
openai-gpt-4o-2024-11-20 | GPT-4o (via Venice) | 128k | Vision |
openai-gpt-4o-mini-2024-07-18 | GPT-4o Mini (via Venice) | 128k | Vision |
gemini-3-1-pro-preview | Gemini 3.1 Pro (via Venice) | 1M | Razonamiento, vision |
gemini-3-pro-preview | Gemini 3 Pro (via Venice) | 198k | Razonamiento, vision |
gemini-3-flash-preview | Gemini 3 Flash (via Venice) | 256k | Razonamiento, vision |
grok-41-fast | Grok 4.1 Fast (via Venice) | 1M | Razonamiento, vision |
grok-code-fast-1 | Grok Code Fast 1 (via Venice) | 256k | Razonamiento, programacion |
Descubrimiento de modelos
OpenClaw descubre automaticamente los modelos de la API de Venice cuando VENICE_API_KEY esta establecida. Si la API no es accesible, recurre a un catalogo estatico.
El endpoint /models es publico (no se necesita autenticacion para listar), pero la inferencia requiere una clave API valida.
Soporte de streaming y herramientas
| Caracteristica | Soporte |
|---|---|
| Streaming | Todos los modelos |
| Llamadas a funciones | La mayoria de los modelos (verifica supportsFunctionCalling en la API) |
| Vision/Imagenes | Modelos marcados con la caracteristica “Vision” |
| Modo JSON | Soportado via response_format |
Precios
Venice usa un sistema basado en creditos. Consulta venice.ai/pricing para las tarifas actuales:
- Modelos privados: Generalmente menor costo
- Modelos anonimizados: Similar al precio directo de la API + una pequena tarifa de Venice
Comparacion: Venice vs API directa
| Aspecto | Venice (Anonimizado) | API directa |
|---|---|---|
| Privacidad | Metadatos eliminados, anonimizado | Tu cuenta vinculada |
| Latencia | +10-50ms (proxy) | Directa |
| Caracteristicas | La mayoria de las caracteristicas soportadas | Todas las caracteristicas |
| Facturacion | Creditos de Venice | Facturacion del proveedor |
Ejemplos de uso
# Usar el modelo privado predeterminado
openclaw agent --model venice/kimi-k2-5 --message "Quick health check"
# Usar Claude Opus a traves de Venice (anonimizado)
openclaw agent --model venice/claude-opus-4-6 --message "Summarize this task"
# Usar modelo sin censura
openclaw agent --model venice/venice-uncensored --message "Draft options"
# Usar modelo de vision con imagen
openclaw agent --model venice/qwen3-vl-235b-a22b --message "Review attached image"
# Usar modelo de programacion
openclaw agent --model venice/qwen3-coder-480b-a35b-instruct --message "Refactor this function"
Solucion de problemas
Clave API no reconocida
echo $VENICE_API_KEY
openclaw models list | grep venice
Asegurate de que la clave comience con vapi_.
Modelo no disponible
El catalogo de modelos de Venice se actualiza dinamicamente. Ejecuta openclaw models list para ver los modelos disponibles actualmente. Algunos modelos pueden estar temporalmente fuera de linea.
Problemas de conexion
La API de Venice esta en https://api.venice.ai/api/v1. Asegurate de que tu red permita conexiones HTTPS.
Ejemplo de archivo de configuracion
{
env: { VENICE_API_KEY: "vapi_..." },
agents: { defaults: { model: { primary: "venice/kimi-k2-5" } } },
models: {
mode: "merge",
providers: {
venice: {
baseUrl: "https://api.venice.ai/api/v1",
apiKey: "${VENICE_API_KEY}",
api: "openai-completions",
models: [
{
id: "kimi-k2-5",
name: "Kimi K2.5",
reasoning: true,
input: ["text", "image"],
cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
contextWindow: 256000,
maxTokens: 65536,
},
],
},
},
},
}