核心动态
6 月 28 日(当地时间),马斯克在 X 上发了条消息:Grok 4.5 要来了。
目前它已经在 SpaceX 和 Tesla 内部跑起了 Beta 测试,后面应该会慢慢对外放。
技术规格与训练策略
- 基座模型:
- 底子是 V9 基座模型。
- 参数量给到了 1.5 万亿。
- 补充训练数据:
- 特意把知名 AI 编程工具 Cursor 的数据加进去了。
- 训练目标:
- 强化学习还在调优,测试用的基准题也在不断更新。
- 性能表现:
- 初步跑下来,效果挺接近甚至可能超过 Anthropic 的旗舰模型 Claude Opus。
激进发布计划:月度迭代
- 发布频率:
SpaceX 打算在今年剩下的时间里,每个月都发一个全新的基础模型。而且每个新模型都是从头训练(trained completely from scratch),不是简单地在旧版上打补丁。 - 行业影响:
- 这节奏比现在行业标准的快多了。
- 要是真能成,跟 OpenAI(GPT 系列)、Google(Gemini 系列)这些巨头之间的竞争怕是要更激烈。
战略收购与生态布局
- 关联动作:
- 本月 16 日,SpaceX 宣布花 60 亿美元 买了 Cursor 背后的开发者 Anysphere。
- 交易预计 2026 年第三季度搞定。
- 战略意图:
- 数据闭环:先在 SpaceX 自家的业务里试 Cursor,拿点真金白银的行业反馈回来优化模型。
- 市场扩张:看 xAI 想把 企业级 AI 市场 这块蛋糕切下来,同时在 AI 编程辅助 这块跟别人抢地盘。
深度分析
-
参数规模与性能的脱钩:
- Grok 4.5 有 1.5 万亿参数,但早期测试显示它不需要堆那么多参数就能把号称“大规模”的 Claude Opus 打得找不着北。
- 这说明啥?可能是架构设计更聪明,或者像这次加的 Cursor 数据质量太高。
- 大模型发展好像要变天了,不再死磕“堆料”,开始追求“质变”。
-
垂直场景驱动通用能力:
- 买 Cursor 不是为了单纯卖代码工具,是想先在 SpaceX/Tesla 这些具体业务里磨刀。
- 用行业应用的数据去喂通用大模型,这种“场景驱动”的招数,说不定比单纯在通用语料库里“死磕”更能练出真本事。
-
发布频率的降维打击:
- “每月从头训练”要是真落地,对行业简直是降维打击。
- 对手们要么得疯狂砸钱买算力,要么得赶紧换条技术路线,行业竞争烈度直接拉满。
注:以上信息基于 2026 年 6 月的相关报道整理。
