快智万义发布全新开源模型Skywork-R1V3.0:多模态推理能力达人类初级专家水平
核心突破
- 模型定位:新一代开源多模态推理模型,能力可比人类初级专家
- 技术基础:基于前代Skywork-R1V2.0进行"bootstrapped"升级
- 训练策略:
- 采用强化学习策略
- 使用高质量蒸馏数据和拒绝采样技术
- 仅需约12,000个监督微调样本和13,000个强化学习样本
核心能力
- 多模态处理:同时支持文本和图像处理
- 跨模态理解:在权威MMMU评估中得分76.0,超越Claude-3.7-Sonnet(75.0)和GPT-4.5(74.4)
- 专业领域表现:
- 物理推理:52.8和31.5(开源模型最佳)
- 逻辑推理:59.7
- 数学推理:
- MathVista:77.1
- MathVerse:59.6
- MathVision:52.6
技术意义
- 实现"小数据触发大能力"的技术突破
- 显著提升复杂逻辑建模和跨学科知识泛化能力
- 开源特性将加速AI技术发展