Deepgram(語音轉文字)

Deepgram 是一款語音轉文字 API。在 OpenClaw 中,它透過 tools.media.audio 用於輸入音訊/語音訊息的轉錄

啟用後,OpenClaw 會將音訊檔案上傳至 Deepgram,並將轉錄內容注入回覆流程({{Transcript}} + [Audio] 區塊)。這不是串流,而是使用預錄轉錄端點。

官網:https://deepgram.com 文件:https://developers.deepgram.com

快速開始

  1. 設定你的 API 金鑰:
DEEPGRAM_API_KEY=dg_...
  1. 啟用供應商:
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}

選項

  • model:Deepgram 模型 ID(預設:nova-3
  • language:語言提示(選用)
  • tools.media.audio.providerOptions.deepgram.detect_language:啟用語言偵測(選用)
  • tools.media.audio.providerOptions.deepgram.punctuate:啟用標點符號(選用)
  • tools.media.audio.providerOptions.deepgram.smart_format:啟用智慧格式化(選用)

指定語言的範例:

{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
      },
    },
  },
}

搭配 Deepgram 選項的範例:

{
  tools: {
    media: {
      audio: {
        enabled: true,
        providerOptions: {
          deepgram: {
            detect_language: true,
            punctuate: true,
            smart_format: true,
          },
        },
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}

注意事項

  • 驗證遵循標準供應商驗證順序;DEEPGRAM_API_KEY 是最簡單的方式。
  • 使用代理時,可透過 tools.media.audio.baseUrltools.media.audio.headers 覆寫端點或標頭。
  • 輸出遵循與其他供應商相同的音訊規則(大小上限、逾時、轉錄注入)。