跳到主要内容

图像理解

通过 chat completions 端点将图像发送给 AI 模型进行分析和理解。

工作原理

具有视觉能力的模型使用与文本模型相同的 /v1/chat/completions 端点,但可以在消息内容中接受图像。您可以使用 data URL 或文件 URL 来包含图像,也可以通过 URL 引用传递图像。

请求格式

OneRoute 支持两种发送图像的方法:

方法一:Data URL(Base64 编码)

curl https://gw.1route.ai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_ONEROUTE_API_KEY" \
-d '{
"model": "openai/gpt-4o",
"messages": [
{
"role": "user",
"content": [
{
"type": "text",
"text": "What is in this image?"
},
{
"type": "image_url",
"image_url": {
"url": "data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAUA..."
}
}
]
}
]
}'

方法二:文件 URL

curl https://gw.1route.ai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_ONEROUTE_API_KEY" \
-d '{
"model": "anthropic/claude-sonnet-4-5",
"messages": [
{
"role": "user",
"content": [
{
"type": "text",
"text": "Describe this image in detail"
},
{
"type": "image_url",
"image_url": {
"url": "https://upload.wikimedia.org/wikipedia/commons/thumb/a/a7/Atlantic_near_Faroe_Islands.jpg/1200px-Atlantic_near_Faroe_Islands.jpg"
}
}
]
}
]
}'

Vertex AI Gemini 模型:当使用文件 URL 与 Vertex AI Gemini 模型时,必须指定 MIME 类型:

{
"type": "image_url",
"image_url": {
"mime_type": "image/jpg",
"url": "https://example.com/image.jpg"
}
}

响应格式

{
"model": "openai/gpt-4o",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "The image shows a beautiful sunset over mountain ranges..."
}
}
]
}

支持的模型

常用的具有视觉能力的模型包括:

  • OpenAI:GPT 模型、o3、o3-pro 以及所有 o4 推理模型
  • Anthropic:Claude 4 和 4.5 模型
  • Google:Gemini 2.5 模型
  • xAI:Grok 4 模型

各服务商特别说明

  • 大多数服务商 同时支持 data URL 和文件 URL
  • Google AI Studio (Gemini) 仅支持 data URL(base64 编码的图像)
  • Vertex AI Gemini 需要在请求中指定 MIME 类型

限制

  • 图像大小限制因服务商和模型而异
  • 文件 URL 必须是可公开访问的
  • Base64 编码的图像会增加请求负载大小
  • 图像分析的响应时间可能比纯文本请求更长