Firecrawl
OpenClaw puede usar Firecrawl como extractor de respaldo para web_fetch. Es un servicio
hospedado de extracción de contenido que soporta evasión de bots y caché, lo que ayuda
con sitios pesados en JS o páginas que bloquean las solicitudes HTTP simples.
Obtener una clave API
- Crea una cuenta de Firecrawl y genera una clave API.
- Guárdala en la configuración o establece
FIRECRAWL_API_KEYen el entorno del gateway.
Configurar Firecrawl
{
tools: {
web: {
fetch: {
firecrawl: {
apiKey: "FIRECRAWL_API_KEY_HERE",
baseUrl: "https://api.firecrawl.dev",
onlyMainContent: true,
maxAgeMs: 172800000,
timeoutSeconds: 60,
},
},
},
},
}
Notas:
firecrawl.enabledtiene por defectotruea menos que se establezca explícitamente afalse.- Los intentos de respaldo de Firecrawl se ejecutan solo cuando hay una clave API disponible (
tools.web.fetch.firecrawl.apiKeyoFIRECRAWL_API_KEY). maxAgeMscontrola la antigüedad máxima de los resultados en caché (ms). El valor por defecto es 2 días.
Stealth / evasión de bots
Firecrawl expone un parámetro de modo proxy para evasión de bots (basic, stealth o auto).
OpenClaw siempre usa proxy: "auto" más storeInCache: true para las solicitudes a Firecrawl.
Si se omite proxy, Firecrawl usa por defecto auto. auto reintenta con proxies stealth si un intento básico falla, lo que puede usar más créditos
que el scraping solo básico.
Cómo web_fetch usa Firecrawl
Orden de extracción de web_fetch:
- Readability (local)
- Firecrawl (si está configurado)
- Limpieza básica de HTML (último respaldo)
Consulta Herramientas web para la configuración completa de herramientas web.