Deepgram（音频转写）

Deepgram 是一个语音转文字 API。在 OpenClaw 中，它通过 tools.media.audio 实现收到的音频/语音消息转写。

启用后，OpenClaw 会将音频文件上传到 Deepgram，并将转写结果注入到回复流水线中（{{Transcript}} + [Audio] 块）。这不是流式的；使用的是预录音转写端点。

官网：https://deepgram.com 文档：https://developers.deepgram.com

快速开始

设置 API 密钥：

DEEPGRAM_API_KEY=dg_...

启用 provider：

{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}

可选配置

model：Deepgram 模型 ID（默认：nova-3）
language：语言提示（可选）
tools.media.audio.providerOptions.deepgram.detect_language：启用语言检测（可选）
tools.media.audio.providerOptions.deepgram.punctuate：启用标点（可选）
tools.media.audio.providerOptions.deepgram.smart_format：启用智能格式化（可选）

指定语言的示例：

{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
      },
    },
  },
}

使用 Deepgram 选项的示例：

{
  tools: {
    media: {
      audio: {
        enabled: true,
        providerOptions: {
          deepgram: {
            detect_language: true,
            punctuate: true,
            smart_format: true,
          },
        },
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}

补充说明

认证遵循标准 provider 认证顺序；DEEPGRAM_API_KEY 是最简单的方式。
使用代理时，可通过 tools.media.audio.baseUrl 和 tools.media.audio.headers 覆盖端点或 header。
输出遵循与其他 provider 相同的音频规则（大小限制、超时、转写注入）。