跳转到主要内容
平台提供两种 API 调用方式,通过 model 参数切换模型:
API 格式端点说明
Chat Completions(默认)POST /v1/chat/completions经典对话接口,兼容所有 OpenAI SDK,查看文档
Responses(新)POST /v1/responsesOpenAI 新一代 Agentic API,支持函数调用、内置工具、服务端多轮上下文,查看文档
标注 Responses Only 的模型仅支持 Responses API,不支持 Chat Completions。其余模型默认通过 Chat Completions 调用。

Anthropic / Claude

模型 ID描述视觉深度思考
claude-haiku-4-5速度最快、成本最低的 Claude 模型,适合高并发轻量任务
claude-sonnet-4-6性能与成本最佳平衡,适合大多数业务场景
claude-opus-4-6Claude 旗舰模型,适合复杂推理与高质量创作

OpenAI / GPT-5

GPT-5 Official(官方直连)

通过 Azure OpenAI 官方 API 直连,稳定性与合规性最高。
模型 ID描述视觉深度思考API 格式
gpt-5-pro-officialGPT-5 Pro 官方直连,OpenAI 最强旗舰推理模型Responses Only
gpt-5.2-officialGPT-5.2 官方直连,多模态增强版全部
gpt-5.3-codex-officialGPT-5.3 Codex 官方直连,最新代码优化版,支持函数调用与内置工具Responses Only

GPT-5 标准

模型 ID描述视觉深度思考
gpt-5OpenAI 旗舰模型,强大的通用推理与多模态能力
gpt-5-codex专为代码优化的 GPT-5,擅长代码生成与调试
gpt-5-codex-mini轻量代码模型,极速响应低成本
gpt-5.1GPT-5 增强版,改进的指令遵循与推理能力
gpt-5.1-codexGPT-5.1 代码专项版本
gpt-5.1-codex-maxGPT-5.1 旗舰代码版,最强代码能力
gpt-5.1-codex-miniGPT-5.1 轻量代码版,快速低成本
gpt-5.2GPT-5 第二代,多模态增强
gpt-5.2-codexGPT-5.2 代码专项版本
gpt-5.3-codexGPT-5 最新代码版本,持续优化的代码能力
gpt-5.3-codex-sparkGPT-5.3 Codex Spark 变体,专注高速代码生成
gpt-5.4GPT-5 第四代,更强的通用推理与多模态能力

Google / Gemini

Gemini 3 系列

模型 ID描述视觉深度思考
gemini-3.1-pro-preview-officialGemini 3.1 Pro,最新一代旗舰推理模型
gemini-3.1-flash-lite-preview-officialGemini 3.1 Flash Lite,最具成本效益的轻量模型,极速响应
gemini-3-pro-officialGemini 3 Pro 旗舰,最强推理与多模态能力
gemini-3-pro-preview-officialGemini 3 Pro Preview 版本(同 gemini-3-pro-official)
gemini-3-flash-officialGemini 3 Flash,快速高效,性价比之选
gemini-3-flash-preview-officialGemini 3 Flash Preview 版本(同 gemini-3-flash-official)
gemini-3.1-fastGemini 快速版,高性价比多模态模型
gemini-3.1-thinkingGemini 思考版,内置推理链,适合复杂问题求解

Gemini 2.5 系列

模型 ID描述视觉深度思考
gemini-2.5-pro-officialGemini 2.5 Pro,强大推理与长上下文能力
gemini-2.5-flash-officialGemini 2.5 Flash,高速推理,支持思考模式
gemini-2.5-flash-lite-officialGemini 2.5 Flash Lite,极低成本超快响应

Gemini 2.0 系列

模型 ID描述视觉深度思考
gemini-2.0-flash-officialGemini 2.0 Flash,经典快速模型
gemini-2.0-flash-lite-officialGemini 2.0 Flash Lite,最低成本轻量模型

DeepSeek

模型 ID描述视觉深度思考
deepseek-v3.2深度求索旗舰模型,支持扩展思考,擅长代码与复杂推理

阿里巴巴 / 通义千问

模型 ID描述视觉深度思考
qwen3-max千问旗舰模型,支持深度思考,擅长复杂推理与代码生成
qwen3.5-plus千问增强版,均衡的性能与成本
qwen3.5-flash千问超快版,极低延迟,高吞吐量场景首选

智谱 / GLM

模型 ID描述视觉深度思考
glm-5智谱旗舰模型,中文理解与生成能力出色

Moonshot / Kimi

模型 ID描述视觉深度思考
kimi-k2.5Moonshot 旗舰模型,超长上下文,中文能力突出

MiniMax

模型 ID描述视觉深度思考
MiniMax-M2.5MiniMax 旗舰模型,性价比卓越