GPT-4o mini 概述
OpenAI 推出 GPT-4o mini 模型,取代 GPT-3.5,成为市场上最具成本效益的小模型。该模型性能超越 GPT-4,同时更加快速且便宜。
性能表现
- MMLU 得分:82%,优于 GPT-4。
- LMSYS 聊天偏好测试:表现优于 GPT-4。
- 文本智能和多模态推理:
- MMLU:82.0%(优于 Gemini Flash 的 77.9% 和 Claude Haiku 的 73.8%)
- MGSM(数学推理):87.0%(高于 Gemini Flash 的 75.5% 和 Claude Haiku 的 71.7%)
- HumanEval(编码性能):87.2%(超过 Gemini Flash 的 71.5% 和 Claude Haiku 的 75.9%)
- MMMU(多模态推理评估):59.4%(比 Gemini Flash 的 56.1% 和 Claude Haiku 的 50.2% 更高)
定价和成本效益
- 输入标记成本:每百万输入标记15美分,比之前的前沿模型便宜一个数量级。
- 输出标记成本:每百万输出标记60美分,比 GPT-3.5 Turbo 便宜60%以上。
多模态能力
- 支持文本和视觉输入,未来将支持图像、视频和音频输入输出。
- 拥有128K标记的上下文窗口,支持每次请求最多16K的输出标记。
用户访问
- 免费用户、Plus 用户和 Team 用户将从今天起可以访问 GPT-4o mini,企业用户将在下周开始访问。
性价比优势
- 大幅降价:相较于GPT-3.5 Turbo,GPT-4o mini具有显著的成本优势。
- 适用于大规模应用:特别是需要大量上下文输入和快速实时响应的应用,如客户支持聊天机器人等。
- 高效能:尽管成本降低,GPT-4o mini在多个评估基准上表现优异。
总结
GPT-4o mini 在多个关键基准上表现出色,以更低的成本提供了强大的性能,尤其是在文本智能、多模态推理、数学推理和编码任务上,适合广泛的大规模应用。
Source:https://xiaohu.ai/p/11477