Uso de tokens y costos
OpenClaw rastrea tokens, no caracteres. Los tokens son específicos del modelo, pero la mayoría de los modelos estilo OpenAI promedian ~4 caracteres por token para texto en inglés.
Cómo se construye el system prompt
OpenClaw ensambla su propio system prompt en cada ejecución. Incluye:
- Lista de herramientas + descripciones cortas
- Lista de habilidades (solo metadatos; las instrucciones se cargan bajo demanda con
read) - Instrucciones de auto-actualización
- Workspace + archivos de bootstrap (
AGENTS.md,SOUL.md,TOOLS.md,IDENTITY.md,USER.md,HEARTBEAT.md,BOOTSTRAP.mdcuando es nuevo, másMEMORY.mdcuando está presente omemory.mdcomo fallback en minúsculas) - Hora (UTC + zona horaria del usuario)
- Tags de respuesta + comportamiento de heartbeat
- Metadatos de runtime (host/OS/modelo/thinking)
Qué cuenta en la ventana de contexto
Todo lo que recibe el modelo cuenta para el límite de contexto: system prompt, historial de conversación, llamadas de herramientas y resultados, adjuntos, resúmenes de compactación, y headers de seguridad del proveedor.
Cómo ver el uso actual de tokens
/status-> tarjeta de estado con modelo de sesión, uso de contexto, tokens de la última respuesta y costo estimado (solo API key)./usage off|tokens|full-> agrega un pie de uso por respuesta a cada respuesta./usage cost-> muestra un resumen de costos local desde los logs de sesión de OpenClaw.
Estimación de costos (cuándo se muestra)
Los costos se estiman desde tu configuración de precios del modelo: models.providers.<provider>.models[].cost. Estos son USD por 1M tokens para input, output, cacheRead y cacheWrite.
Impacto de TTL de caché y poda
El caché de prompts del proveedor solo aplica dentro de la ventana de TTL del caché. OpenClaw puede opcionalmente ejecutar poda por cache-ttl: poda la sesión una vez que el TTL del caché ha expirado.
El heartbeat puede mantener la caché caliente durante períodos de inactividad.
Consejos para reducir la presión de tokens
- Usa
/compactpara resumir sesiones largas. - Recorta salidas grandes de herramientas en tus flujos de trabajo.
- Reduce
agents.defaults.imageMaxDimensionPxpara sesiones con muchas capturas de pantalla. - Mantén las descripciones de habilidades cortas (la lista de habilidades se inyecta en el prompt).
- Prefiere modelos más pequeños para trabajo verboso y exploratorio.
Consulta Habilidades para la fórmula exacta del overhead de la lista de habilidades.