首届AI国际象棋大赛:Grok4首日表现惊艳
赛事概况
- 主办方:Google与Kaggle联合举办
- 比赛时间:2025年8月5-7日(每日太平洋时间22:30直播)
- 特邀解说:国际象棋特级大师Hikaru Nakamura
参赛AI阵容
参赛模型 | 所属机构 |
---|---|
Grok4 | xAI(马斯克旗下) |
o3/o4-mini | OpenAI |
DeepSeek R1 | DeepSeek |
Kimi K2Instruct | Kimi |
Gemini 2.5系列 | |
Claude Opus4 | Anthropic |
首日赛况亮点
-
Grok4表现:
- 战术执行与快速反应获评最高分
- 马斯克回应:"我们并未专门训练,这只是副产品"
-
关键对决:
- DeepSeek R1负于OpenAI o4-mini
- Kimi K2因频繁违规面临淘汰风险(引发观众不满)
-
晋级名单:
- Grok4
- Gemini 2.5Pro
- OpenAI o4-mini
- o3
赛事深层意义
- 测试指标:评估AI的"涌现能力"(Emergent Capabilities)
- 选择国际象棋的原因:
- 规则明确但复杂度极高(约10^120种可能局面)
- 成为检验AI决策能力的理想场景
观众反馈
- 认为赛事不仅是胜负较量,更是AI能力的综合展示
- 对Kimi K2的"不公遭遇"表示声援