AI-NEWS · 2025年 6月 30日

谷歌发布Gemma 3模型

Google Gemma 3n 技术分析报告

核心产品概览

产品名称: Google Gemma 3n（第三代非设备端模型）
前代版本: Gemma 1.6
发布渠道: Google AI Studio/Hugging Face/Kaggle/Google Cloud Vertex AI

关键技术指标

参数类别	具体配置
模型规模	2B/4B/10B参数版本
基准测试	lmarena.ai评分1300（100基准分）
延迟表现	160ms/token（ASR场景）
硬件适配	支持Transformer CPU部署
视频处理	MobileNet-V5架构@60fps（Pixel设备）

架构创新

MatFormer框架
- 采用Matryoshka嵌套式Transformer结构
- 支持E2B到E4B的弹性扩展
混合训练技术
- Mix-n-Match模块化训练方案
- PLE（Per-Layer Embeddings）分层嵌入
优化技术
- KV Cache共享机制
- USM（Universal Speech Model）语音支持
- SoViT视觉Transformer集成（4-46层可变深度）

性能表现

效率提升: 较前代1.6版本显著降低推理延迟
多模态支持: 同步优化ASR（语音识别）和RAST（视频分析）任务
移动端适配: 在Google Pixel设备实现768维特征@60fps

生态部署

开发者入口: 通过Google AI Studio提供API
模型仓库: Hugging Face平台托管
云服务集成: 深度对接Google Cloud Vertex AI

潜在应用方向

边缘计算场景的实时语音交互
移动端视频内容理解
参数可调节的轻量化AI服务

火龙果频道

您可能还喜欢...