Global Model Radar

全球 AI 新模型追踪

不只看 OpenAI、Anthropic、Google，也追踪 Qwen、DeepSeek、Kimi、GLM、文心、豆包等中国模型。页面优先用能力图、Token/费用条和历史卡片展示，减少大段文字。

怎么读这个页面

先看能力图判断强项，再看 Token、费用和历史模型变化。想了解影响和普通用户选择，再看对应评论。

查看 Mistral 3 判断指南 →

美国GPT-5.6 Sol / Terra / Luna / ChatGPT Work

OpenAI

OpenAI 现在最值得看的不是只看 GPT-5.5 更强，而是 GPT-5.4 和 GPT-5.5 已经明确分成了默认高价值工作层和高返工成本 Agent 层，而 Codex 的手机协作与 Remote SSH 又把执行层往前推了一步。

综合 85

Token / 费用

Official model page: verify current context in console

输入：$5.00 / 1M tokens

输出：$30.00 / 1M tokens

美国Claude Sonnet 4.6 / Claude Opus 4.5

Anthropic Claude

Anthropic 现在最值得看的是默认层已经重新分工：Sonnet 4.6 更适合做日常高频主力层，Opus 4.5 则更像高返工成本任务的升级层，1M context beta 让长任务边界继续外扩。

综合 82

Token / 费用

按 Anthropic 官方模型页核准

输入：$5 / 1M tokens

输出：$25 / 1M tokens

美国Gemini 3.5 Flash / Gemini 3.5 Pro

Google Gemini / Gemma

Google 现在最值得看的不是单个“最强”型号，而是 Gemini 3.5 Flash、即将公开的 3.5 Pro、Gemini Omni 与 Antigravity 2.0 一起把默认模型层、视频创作层、编码 Agent 层和生态入口重新排了一次序。

综合 90

Token / 费用

GA via Gemini app / Search / Antigravity / Gemini API; public API pricing page still catching up

输入：Public standalone 3.5 Flash API pricing not yet listed

输出：Validate with current Google pricing page before budgeting

中国Qwen3.7-Max / Qwen3.6-27B / Qwen3.6-Max-Preview / Qwen3.5-LiveTranslate-Flash

通义千问 Qwen

Qwen 已把旗舰叙事从中文问答和代码助手推进到 Agent 主力位：Qwen3.7-Max 强调长时执行与跨脚手架，LiveTranslate-Flash 则把实时翻译推进到多模态场景。

综合 86

Token / 费用

Agent-first cloud flagship; public rollout and region access should be rechecked in Model Studio

输入：以控制台和官方最新价格页为准

输出：以控制台和官方最新价格页为准

中国DeepSeek V4 Preview / Flash / Pro

DeepSeek

DeepSeek 现在最值得看的是 V4 Preview：1M 上下文、Flash / Pro 双层价格和开源权重一起把默认流量层、高价值层和自部署路线都推到了台前。

综合 86

Token / 费用

1M context，官方同时提供 API 与开源权重路线

输入：$0.435 / 1M uncached, $0.003625 / 1M cached

输出：$0.87 / 1M tokens

美国Grok 4.3 / Grok 4.20

xAI Grok

xAI 现在最值得盯的是旧线退役已经给出绝对时间，grok-4.3 正在接管推理主力位，grok-4.20-non-reasoning 正在接管低延迟与长上下文吞吐层。

综合 88

Token / 费用

1M context / reasoning_effort: none-low-medium-high

输入：$1.25 / 1M

输出：$2.50 / 1M

欧洲Mistral 3 / Mistral Large 3

Mistral AI

Mistral 现在最值得看的不是单个欧洲标签，而是 Medium 3.5 把开放权重旗舰、远程编码 Agent、Le Chat Work mode 和企业私有化路线收到了同一条产品线上。

综合 82

Token / 费用

41B active / 675B total / multimodal / multilingual / Apache 2.0

输入：Hosted pricing varies by provider

输出：Hosted pricing varies by provider

中国Kimi K3 / Kimi K2.6 / Qwen3.6-27B / Qwen3.6-35B-A3B / GLM / 文心 / 豆包

中国模型生态

中国模型现在最值得看的，是 Kimi K3 把开放权重、1M 上下文、视觉能力和高价值 coding / agent 任务进一步推上台面，不只看单次排行榜。

综合 89

Token / 费用

1M context，原生视觉，16 / 896 experts active

输入：$0.30 / 1M cached, $3.00 / 1M uncached

输出：$15.00 / 1M tokens