Deepgram (Audio-Transkription)
Deepgram ist eine Speech-to-Text-API. In OpenClaw wird sie für die Transkription eingehender Audio-/Sprachnachrichten über tools.media.audio verwendet.
Wenn aktiviert, lädt OpenClaw die Audiodatei zu Deepgram hoch und fügt das Transkript
in die Antwort-Pipeline ein ({{Transcript}} + [Audio]-Block). Das ist kein Streaming;
es nutzt den Endpunkt für voraufgezeichnete Transkription.
Website: https://deepgram.com Docs: https://developers.deepgram.com
Schnellstart
- API-Key setzen:
DEEPGRAM_API_KEY=dg_...
- Provider aktivieren:
{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "deepgram", model: "nova-3" }],
},
},
},
}
Optionen
model: Deepgram-Modell-ID (Standard:nova-3)language: Sprachhinweis (optional)tools.media.audio.providerOptions.deepgram.detect_language: Spracherkennung aktivieren (optional)tools.media.audio.providerOptions.deepgram.punctuate: Zeichensetzung aktivieren (optional)tools.media.audio.providerOptions.deepgram.smart_format: Smart-Formatierung aktivieren (optional)
Beispiel mit Sprache:
{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
},
},
},
}
Beispiel mit Deepgram-Optionen:
{
tools: {
media: {
audio: {
enabled: true,
providerOptions: {
deepgram: {
detect_language: true,
punctuate: true,
smart_format: true,
},
},
models: [{ provider: "deepgram", model: "nova-3" }],
},
},
},
}
Hinweise
- Authentifizierung folgt der Standard-Provider-Auth-Reihenfolge;
DEEPGRAM_API_KEYist der einfachste Weg. - Endpunkte oder Header mit
tools.media.audio.baseUrlundtools.media.audio.headersüberschreiben, wenn ein Proxy verwendet wird. - Die Ausgabe folgt denselben Audio-Regeln wie andere Provider (Größenlimits, Timeouts, Transkript-Injection).