Deepgram(語音轉文字)
Deepgram 是一款語音轉文字 API。在 OpenClaw 中,它透過 tools.media.audio 用於輸入音訊/語音訊息的轉錄。
啟用後,OpenClaw 會將音訊檔案上傳至 Deepgram,並將轉錄內容注入回覆流程({{Transcript}} + [Audio] 區塊)。這不是串流,而是使用預錄轉錄端點。
官網:https://deepgram.com 文件:https://developers.deepgram.com
快速開始
- 設定你的 API 金鑰:
DEEPGRAM_API_KEY=dg_...
- 啟用供應商:
{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "deepgram", model: "nova-3" }],
},
},
},
}
選項
model:Deepgram 模型 ID(預設:nova-3)language:語言提示(選用)tools.media.audio.providerOptions.deepgram.detect_language:啟用語言偵測(選用)tools.media.audio.providerOptions.deepgram.punctuate:啟用標點符號(選用)tools.media.audio.providerOptions.deepgram.smart_format:啟用智慧格式化(選用)
指定語言的範例:
{
tools: {
media: {
audio: {
enabled: true,
models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
},
},
},
}
搭配 Deepgram 選項的範例:
{
tools: {
media: {
audio: {
enabled: true,
providerOptions: {
deepgram: {
detect_language: true,
punctuate: true,
smart_format: true,
},
},
models: [{ provider: "deepgram", model: "nova-3" }],
},
},
},
}
注意事項
- 驗證遵循標準供應商驗證順序;
DEEPGRAM_API_KEY是最簡單的方式。 - 使用代理時,可透過
tools.media.audio.baseUrl和tools.media.audio.headers覆寫端點或標頭。 - 輸出遵循與其他供應商相同的音訊規則(大小上限、逾時、轉錄注入)。