图像理解
通过 chat completions 端点将图像发送给 AI 模型进行分析和理解。
工作原理
具有视觉能力的模型使用与文本模型相同的 /v1/chat/completions 端点,但可以在消息内容中接受图像。您可以使用 data URL 或文件 URL 来包含图像,也可以通过 URL 引用传递图像。
请求格式
OneRoute 支持两种发送图像的方法:
方法一:Data URL(Base64 编码)
curl https://gw.1route.ai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_ONEROUTE_API_KEY" \
-d '{
"model": "openai/gpt-4o",
"messages": [
{
"role": "user",
"content": [
{
"type": "text",
"text": "What is in this image?"
},
{
"type": "image_url",
"image_url": {
"url": "data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAUA..."
}
}
]
}
]
}'
方法二:文件 URL
curl https://gw.1route.ai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_ONEROUTE_API_KEY" \
-d '{
"model": "anthropic/claude-sonnet-4-5",
"messages": [
{
"role": "user",
"content": [
{
"type": "text",
"text": "Describe this image in detail"
},
{
"type": "image_url",
"image_url": {
"url": "https://upload.wikimedia.org/wikipedia/commons/thumb/a/a7/Atlantic_near_Faroe_Islands.jpg/1200px-Atlantic_near_Faroe_Islands.jpg"
}
}
]
}
]
}'
Vertex AI Gemini 模型:当使用文件 URL 与 Vertex AI Gemini 模型时,必须指定 MIME 类型:
{
"type": "image_url",
"image_url": {
"mime_type": "image/jpg",
"url": "https://example.com/image.jpg"
}
}
响应格式
{
"model": "openai/gpt-4o",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "The image shows a beautiful sunset over mountain ranges..."
}
}
]
}
支持的模型
常用的具有视觉能力的模型包括:
- OpenAI:GPT 模型、o3、o3-pro 以及所有 o4 推理模型
- Anthropic:Claude 4 和 4.5 模型
- Google:Gemini 2.5 模型
- xAI:Grok 4 模型
各服务商特别说明
- 大多数服务商 同时支持 data URL 和文件 URL
- Google AI Studio (Gemini) 仅支持 data URL(base64 编码的图像)
- Vertex AI Gemini 需要在请求中指定 MIME 类型
限制
- 图像大小限制因服务商和模型而异
- 文件 URL 必须是可公开访问的
- Base64 编码的图像会增加请求负载大小
- 图像分析的响应时间可能比纯文本请求更长