Deepgram (Transcripcion de audio)
Deepgram es una API de conversion de voz a texto. En OpenClaw se usa para la transcripcion de audio/notas de voz entrantes a traves de tools.media.audio.
Cuando esta habilitado, OpenClaw sube el archivo de audio a Deepgram e inyecta la transcripcion en el pipeline de respuesta ({{Transcript}} + bloque [Audio]). Esto no es streaming; usa el endpoint de transcripcion pregrabada.
Sitio web: https://deepgram.com Documentacion: https://developers.deepgram.com
Inicio rapido
- Establece tu clave API:
DEEPGRAM_API_KEY=dg_...
- Habilita el proveedor:
{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "deepgram", model: "nova-3" }],
},
},
},
}
Opciones
model: ID del modelo de Deepgram (por defecto:nova-3)language: indicacion de idioma (opcional)tools.media.audio.providerOptions.deepgram.detect_language: activar deteccion de idioma (opcional)tools.media.audio.providerOptions.deepgram.punctuate: activar puntuacion (opcional)tools.media.audio.providerOptions.deepgram.smart_format: activar formato inteligente (opcional)
Ejemplo con idioma:
{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
},
},
},
}
Ejemplo con opciones de Deepgram:
{
tools: {
media: {
audio: {
enabled: true,
providerOptions: {
deepgram: {
detect_language: true,
punctuate: true,
smart_format: true,
},
},
models: [{ provider: "deepgram", model: "nova-3" }],
},
},
},
}
Notas
- La autenticacion sigue el orden estandar de autenticacion del proveedor;
DEEPGRAM_API_KEYes la forma mas sencilla. - Sobreescribe endpoints o headers con
tools.media.audio.baseUrlytools.media.audio.headerscuando uses un proxy. - La salida sigue las mismas reglas de audio que otros proveedores (limites de tamano, timeouts, inyeccion de transcripcion).