Skip to main content

Deepgram(音频转写)

Deepgram 是语音转文本 API。在 OpenClaw 中它用于 tools.media.audio入站音频/语音消息转写 启用后,OpenClaw 会将音频文件上传到 Deepgram,并将转写结果注入回复管道({{Transcript}} + [Audio] 块)。这 不是流式;使用预录转写端点。 官网:https://deepgram.com
文档:https://developers.deepgram.com

快速开始

  1. 设置 API key:
DEEPGRAM_API_KEY=dg_...
  1. 启用 provider:
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}

选项

  • model:Deepgram 模型 id(默认:nova-3
  • language:语言提示(可选)
  • tools.media.audio.providerOptions.deepgram.detect_language:启用语言检测(可选)
  • tools.media.audio.providerOptions.deepgram.punctuate:启用标点(可选)
  • tools.media.audio.providerOptions.deepgram.smart_format:启用智能格式化(可选)
带语言示例:
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
      },
    },
  },
}
带 Deepgram 选项示例:
{
  tools: {
    media: {
      audio: {
        enabled: true,
        providerOptions: {
          deepgram: {
            detect_language: true,
            punctuate: true,
            smart_format: true,
          },
        },
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}

说明

  • 认证遵循标准 provider 认证顺序;DEEPGRAM_API_KEY 是最简单的方式。
  • 使用代理时,可用 tools.media.audio.baseUrltools.media.audio.headers 覆盖端点/头部。
  • 输出遵循其他 provider 相同的音频规则(大小限制、超时、转写注入)。