马斯克 xAI "博士级" AI,地球最强大模型
2025年7月9日
xAI(马斯克创立)
256K tokens(多模态)
SuperGrok $30/月 或 $3000/年
首代模型,幽默对话风格
性能提升,支持图像生成
思维链推理,10万 H100 训练
跳过 3.5,AIME 2025 满分,博士级能力
全能多模态模型,博士级能力
多智能体系统,AIME 2025 满分
1/25 成本达到 Gemini 2.5 Pro 水平
马斯克称"各方面达到研究生甚至博士水平"
AIME 2025 满分,超越所有竞品
图像生成/编辑(2025.8)、视频(2025.9-10)
X/Twitter 平台实时数据访问
Grok 4 Heavy 多智能体协作
叛逆有趣,敢于讨论敏感话题
| 测试 | Grok 4 Heavy | GPT-5.2 Pro | Gemini 3 Pro | Claude Opus 4.5 |
|---|---|---|---|---|
| AIME 2025 | 100% 满分 | ~85% | ~80% | ~75% |
| 数学推理 | 最强 | 强 | 强 | 强 |
| Agent 能力 | 多 Agent | 单 Agent | Antigravity | Computer Use |
| 实时数据 | X 平台 | 联网搜索 | Google 搜索 | ❌ |
| 上下文 | 256K | ~400K | 100万 | 200K |
AIME 满分级别的数学推理
X 平台热点、舆情分析
多步骤自动化任务(Heavy)
幽默风格、无过多限制
Heavy 是多智能体系统,适合复杂推理任务,在 AIME 等数学测试中表现更强。普通版适合日常使用。
对于需要顶级数学推理、研究级任务的用户值得。普通用户 $16/月的 Premium+ 足够。
支持,但英文效果更好。
xAI 直接从 Grok 3 跳到 Grok 4,展示在 AI 竞赛中加速前进的决心。