Global Model Radar

全球 AI 新模型追踪

不只看 OpenAI、Anthropic、Google,也追踪 Qwen、DeepSeek、Kimi、GLM、文心、豆包等中国模型。 页面优先用能力图、Token/费用条和历史卡片展示,减少大段文字。

怎么读这个页面

先看能力图判断强项,再看 Token、费用和历史模型变化。想了解影响和普通用户选择,再看对应评论。

查看今日模型判断 →
美国GPT-5.5 / GPT-5 系列

OpenAI

旗舰通用能力强,适合把写作、代码、Agent 和多模态任务统一到一个主入口。

综合 85

推理98
代码97
中文89
多模态94
上下文94

Token / 费用

1,050,000 context / 128,000 max output

输入:$5.00 / 1M tokens

输出:$30.00 / 1M tokens

美国Claude Opus 4.7 / Claude Design

Anthropic Claude

强项在长文档、写作、代码审查、企业级 Agent 工作流与创建设计输出,适合高质量输出场景。

综合 82

推理95
代码92
中文84
多模态88
上下文94

Token / 费用

按 Anthropic 官方模型页核准

输入:$5 / 1M tokens

输出:$25 / 1M tokens

美国Gemini / Gemma 4 生态

Google Gemini / Gemma

Gemini 适合 Google 生态和多模态,Gemma 代表开放模型和本地部署方向。

综合 85

推理91
代码86
中文82
多模态96
上下文95

Token / 费用

长上下文

输入:见 Gemini API 定价

输出:见 Gemini API 定价

中国Qwen3.6-Max-Preview / Qwen3.6-35B-A3B

通义千问 Qwen

中文、代码、开源生态和企业落地能力都强,云端 Max Preview 负责 Agent 编程,开源 35B-A3B 则把重点推向私有化和低成本落地。

综合 85

推理92
代码92
中文94
多模态76
上下文88

Token / 费用

云端预览模型,以阿里云 Model Studio 为准

输入:以阿里云模型服务价格为准

输出:以阿里云模型服务价格为准

中国DeepSeek V4 Preview / Flash / Pro

DeepSeek

DeepSeek 现在最值得看的是 V4 Preview:1M 上下文、Flash / Pro 双层价格和开源权重一起把默认流量层、高价值层和自部署路线都推到了台前。

综合 85

推理95
代码92
中文90
多模态58
上下文95

Token / 费用

1M context,官方同时提供 API 与开源权重路线

输入:$0.56 / 1M uncached, $0.112 / 1M cached

输出:$1.68 / 1M tokens

美国Grok 4 系列

xAI Grok

优势在实时信息、社交内容理解和个性化风格,适合作为热点追踪与创意辅助。

综合 80

推理88
代码82
中文76
多模态84
上下文82

Token / 费用

按 xAI 模型页核准

输入:见 xAI 定价

输出:见 xAI 定价

欧洲Mistral Large / Small / Codestral 系列

Mistral AI

欧洲代表模型,强在开放生态、企业部署、代码和成本控制。

综合 78

推理84
代码84
中文70
多模态70
上下文78

Token / 费用

按 Mistral 文档核准

输入:见 Mistral 定价

输出:见 Mistral 定价

中国Kimi K2.6 / Qwen3.6-35B-A3B / GLM / 文心 / 豆包

中国模型生态

中国模型要重点看中文、办公、搜索、长文本、开放权重、代码 Agent 和本地生态,不只看单次排行榜。

综合 87

推理88
代码90
中文92
多模态82
上下文94

Token / 费用

官方强调 256K context 与长时编程工作流

输入:以 Kimi/API/Hugging Face 托管成本为准

输出:以 Kimi/API/Hugging Face 托管成本为准