AI-NEWS · 2026年 1月 30日

Gemini 3.5代码生成超GPT-5.2

Gemini 3.5 “雪兔”模型泄露:一键生成3000行代码,性能据称超越GPT-5.2

发布日期:2026年1月29日
来源:AIbase Daily

核心摘要

近期,谷歌旗下Gemini系列AI模型发生重大信息泄露。一款内部代号为“雪兔”(Snow Bunny)的模型被曝光,其宣称的强大功能在业内引起震动。据泄露信息显示,该模型在代码生成能力和综合性能基准测试中表现突出,甚至超越了尚未发布的竞争对手模型。

泄露详情与主要特性

1. 革命性的应用构建能力

  • 模型定位:泄露的“雪兔”被描述为一个革命性的检查点模型。
  • 核心功能:能够根据单一提示词,一次性生成并构建完整的应用程序。这标志着AI在软件开发领域的飞跃,有望极大简化从概念到成品的流程,重塑开发者工作流。

2. 卓越的代码生成效率

  • 生成规模:据称,该模型仅凭一个提示词就能生成高达3000行可执行代码。
  • 质量保证:泄露信息强调,生成的代码不仅效率高,而且具备实用性和可靠性,为复杂项目提供了高效解决方案。

3. 新增专业模型阵容

Gemini 3.5系列引入了两款专注于不同领域的专业模型:

  • “猛禽猎隼”:专注于纯速度和逻辑处理,适用于需要快速计算的场景。
  • “幽灵猎隼”:擅长UI设计、视觉元素和音频创作,拓展了AI在多媒体领域的应用。两款模型的组合增强了Gemini的综合能力。

4. 宣称的性能优势

  • 基准测试表现:在泄露的基准测试中,Gemini 3.5得分为75.40
  • 竞争对手对比:该分数据称超越了尚未发布的GPT-5.2,并优于Claude Opus 4.5。这突显了谷歌在AI性能优化方面的领先优势。

5. 深度思考与推理机制

  • “深度思考”模式:新增功能,专为处理高级逻辑问题设计。该模式让AI在回应前进行深入分析,提高问题解决的准确性。
  • System2推理框架:采用类似人类“先暂停思考,再输出答案”的认知机制,确保输出结果更深思熟虑、更可靠。
  • 推理基准得分:在困难推理基准测试中,该模型取得了80分的优异成绩,远超竞争对手的55分,证明了其在复杂任务上的强大竞争力。

6. API接口确认

泄露信息中确认了API接口变量为 gemini-for-google-3.5,表明该模型已为开发者集成做好准备。

行业背景与相关动态(同日摘要)

同日AI领域其他重要新闻,反映了行业的快速发展和多元竞争:

  1. 机器人大型模型:宇树科技创始人王兴兴称,率先将大模型与机器人硬件结合的公司将引领全球AI发展,其技术突破意义重大。
  2. 平台政策调整:Meta调整WhatsApp政策,在部分地区对第三方AI机器人改为“按消息计费”模式。
  3. AI硬件布局:字节跳动加速AI硬件布局,计划在2026年推出第二代抖音手机。
  4. AI音乐突破:MiniMax正式发布Music 2.5,旨在突破AI音乐在可控性和真实性方面的瓶颈。
  5. 多模态视频生成:昆仑万维开源SkyReels-V3,在参考图生视频、视频延长、音频驱动数字人三项功能上取得突破。
  6. 应用商店伦理危机:调查发现苹果App Store存在数十款未经用户同意即可生成虚假裸露图像的“AI脱衣”应用。
  7. 开源世界模型:蚂蚁灵博开源LingBot-World,为具身AI和自动驾驶提供高保真虚拟训练环境。
  8. 工业AI进展:蘑菇物联“灵芝AI”垂直大模型通过国家网信办备案,成为工业辅助能源领域标杆AI产品。

观点与分析

  • 性能宣称需谨慎对待:泄露信息中关于“超越GPT-5.2”的表述尤其值得注意,因为GPT-5.2本身尚未发布,此类对比缺乏官方基准验证。
  • 开发效率的潜在变革:如果“一键生成完整应用”的能力属实,将显著降低软件开发门槛,可能引发生产工具的革命。
  • AI模型专业化趋势:“猛禽猎隼”与“幽灵猎隼”的分工,体现了通用大模型向垂直、专业化方向发展的行业趋势,以在特定任务上追求极致性能。
  • 行业竞争白热化:从同日多起关于模型发布、硬件布局、开源和伦理问题的新闻可以看出,AI领域的技术、商业和监管竞争正全面加剧。

:本文内容基于网络泄露信息及AIbase Daily的整理报道,相关性能数据及功能细节尚未得到谷歌官方证实。

火龙果频道