Firecrawl
OpenClaw kann Firecrawl als Fallback-Extrahierer für web_fetch verwenden. Es ist ein gehosteter
Content-Extraktionsdienst, der Bot-Umgehung und Caching unterstützt, was bei
JS-lastigen Seiten oder Seiten hilft, die einfache HTTP-Fetches blockieren.
API-Key besorgen
- Erstelle ein Firecrawl-Konto und generiere einen API-Key.
- Speichere ihn in der Konfiguration oder setze
FIRECRAWL_API_KEYin der Gateway-Umgebung.
Firecrawl konfigurieren
{
tools: {
web: {
fetch: {
firecrawl: {
apiKey: "FIRECRAWL_API_KEY_HERE",
baseUrl: "https://api.firecrawl.dev",
onlyMainContent: true,
maxAgeMs: 172800000,
timeoutSeconds: 60,
},
},
},
},
}
Hinweise:
firecrawl.enabledist standardmäßigtrue, es sei denn, explizit auffalsegesetzt.- Firecrawl-Fallback-Versuche werden nur durchgeführt, wenn ein API-Key verfügbar ist (
tools.web.fetch.firecrawl.apiKeyoderFIRECRAWL_API_KEY). maxAgeMssteuert, wie alt gecachte Ergebnisse sein dürfen (ms). Standard sind 2 Tage.
Stealth / Bot-Umgehung
Firecrawl bietet einen Proxy-Modus-Parameter für Bot-Umgehung (basic, stealth oder auto).
OpenClaw verwendet immer proxy: "auto" plus storeInCache: true für Firecrawl-Anfragen.
Wenn Proxy weggelassen wird, verwendet Firecrawl standardmäßig auto. auto versucht es mit Stealth-Proxies erneut, wenn ein Basis-Versuch fehlschlägt, was mehr Credits
verbrauchen kann als reines Basis-Scraping.
Wie web_fetch Firecrawl verwendet
web_fetch-Extraktionsreihenfolge:
- Readability (lokal)
- Firecrawl (wenn konfiguriert)
- Einfache HTML-Bereinigung (letzter Fallback)
Siehe Web-Tools für das vollständige Web-Tool-Setup.