音频输入

如何向 OneRoute 模型发送音频文件。

OneRoute 支持通过 API 向兼容的模型发送音频文件。本指南将向您展示如何使用我们的 API 处理音频。

注意：音频文件必须经过 base64 编码 - 音频内容不支持直接使用 URL。

音频输入

通过 /api/v1/chat/completions API 使用 input_audio 内容类型，可以向兼容模型发送包含音频文件的请求。音频文件必须经过 base64 编码并包含格式规范。请注意，只有具有音频处理能力的模型才能处理这些请求。

发送音频文件

以下是发送音频文件进行处理的方法：

Python

import openai
import base64

client = openai.OpenAI(
    api_key="YOUR_ONEROUTE_API_KEY",
    base_url="https://gw.1route.ai/v1",
)

# 将音频文件编码为 base64
def encode_audio_to_base64(audio_path: str) -> str:
    with open(audio_path, "rb") as audio_file:
        return base64.b64encode(audio_file.read()).decode("utf-8")

# 读取并编码音频文件
audio_path = "path/to/your/audio.wav"
base64_audio = encode_audio_to_base64(audio_path)

result = client.chat.completions.create(
    model="your-model",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Please transcribe this audio file."
                },
                {
                    "type": "input_audio",
                    "input_audio": {
                        "data": base64_audio,
                        "format": "wav"
                    }
                }
            ]
        }
    ]
)

print(result.choices[0].message.content)

支持的音频格式

支持的音频格式因提供商而异。常见格式包括：

格式	说明
`wav`	WAV 音频
`mp3`	MP3 音频
`aiff`	AIFF 音频
`aac`	AAC 音频
`ogg`	OGG Vorbis 音频
`flac`	FLAC 音频
`m4a`	M4A 音频
`pcm16`	PCM16 音频
`pcm24`	PCM24 音频

注意：请查看您的模型文档以确认其支持哪些音频格式。并非所有模型都支持所有格式。

音频输入​

发送音频文件​

支持的音频格式​

音频输入

发送音频文件

支持的音频格式