音频输入
如何向 OneRoute 模型发送音频文件。
OneRoute 支持通过 API 向兼容的模型发送音频文件。本指南将向您展示如何使用我们的 API 处理音频。
注意:音频文件必须经过 base64 编码 - 音频内容不支持直接使用 URL。
音频输入
通过 /api/v1/chat/completions API 使用 input_audio 内容类型,可以向兼容模型发送包含音频文件的请求。音频文件必须经过 base64 编码并包含格式规范。请注意,只有具有音频处理能力的模型才能处理这些请求。
发送音频文件
以下是发送音频文件进行处理的方法:
- Python
import openai
import base64
client = openai.OpenAI(
api_key="YOUR_ONEROUTE_API_KEY",
base_url="https://gw.1route.ai/v1",
)
# 将音频文件编码为 base64
def encode_audio_to_base64(audio_path: str) -> str:
with open(audio_path, "rb") as audio_file:
return base64.b64encode(audio_file.read()).decode("utf-8")
# 读取并编码音频文件
audio_path = "path/to/your/audio.wav"
base64_audio = encode_audio_to_base64(audio_path)
result = client.chat.completions.create(
model="your-model",
messages=[
{
"role": "user",
"content": [
{
"type": "text",
"text": "Please transcribe this audio file."
},
{
"type": "input_audio",
"input_audio": {
"data": base64_audio,
"format": "wav"
}
}
]
}
]
)
print(result.choices[0].message.content)
支持的音频格式
支持的音频格式因提供商而异。常见格式包括:
| 格式 | 说明 |
|---|---|
wav | WAV 音频 |
mp3 | MP3 音频 |
aiff | AIFF 音频 |
aac | AAC 音频 |
ogg | OGG Vorbis 音频 |
flac | FLAC 音频 |
m4a | M4A 音频 |
pcm16 | PCM16 音频 |
pcm24 | PCM24 音频 |
注意:请查看您的模型文档以确认其支持哪些音频格式。并非所有模型都支持所有格式。