跳到主要内容

音频输入

如何向 OneRoute 模型发送音频文件。

OneRoute 支持通过 API 向兼容的模型发送音频文件。本指南将向您展示如何使用我们的 API 处理音频。

注意:音频文件必须经过 base64 编码 - 音频内容不支持直接使用 URL。

音频输入

通过 /api/v1/chat/completions API 使用 input_audio 内容类型,可以向兼容模型发送包含音频文件的请求。音频文件必须经过 base64 编码并包含格式规范。请注意,只有具有音频处理能力的模型才能处理这些请求。

发送音频文件

以下是发送音频文件进行处理的方法:

import openai
import base64

client = openai.OpenAI(
api_key="YOUR_ONEROUTE_API_KEY",
base_url="https://gw.1route.ai/v1",
)

# 将音频文件编码为 base64
def encode_audio_to_base64(audio_path: str) -> str:
with open(audio_path, "rb") as audio_file:
return base64.b64encode(audio_file.read()).decode("utf-8")

# 读取并编码音频文件
audio_path = "path/to/your/audio.wav"
base64_audio = encode_audio_to_base64(audio_path)

result = client.chat.completions.create(
model="your-model",
messages=[
{
"role": "user",
"content": [
{
"type": "text",
"text": "Please transcribe this audio file."
},
{
"type": "input_audio",
"input_audio": {
"data": base64_audio,
"format": "wav"
}
}
]
}
]
)

print(result.choices[0].message.content)

支持的音频格式

支持的音频格式因提供商而异。常见格式包括:

格式说明
wavWAV 音频
mp3MP3 音频
aiffAIFF 音频
aacAAC 音频
oggOGG Vorbis 音频
flacFLAC 音频
m4aM4A 音频
pcm16PCM16 音频
pcm24PCM24 音频

注意:请查看您的模型文档以确认其支持哪些音频格式。并非所有模型都支持所有格式。