2025年AI技术发展报告
主要AI模型与厂商分析
1. 语言模型领域
-
OpenAI
- GPT-4.1(市场占比10%)
- o3o4-mini等轻量级版本
- GPT-Image-1(图像生成API,调用量4次/17单位)
-
Google
- Gemini 2.5 Pro(市场占比5%,性能评分6/30)
- Gemini 2.5 Flash Preview
- Imagen 3(图像生成,调用量10/30单位)
-
Anthropic
- Claude 3.5/3.7 Sonnet(市场占比10%)
-
DeepSeek
- R12743等版本(Poe平台占比12%)
-
xAI
- Grok-3系列(市场占比仅1%)
2. 图像/视频生成领域
- Google Veo 2:生成量20单位
- Runway:生成量40单位(成本20单位)
- Kling 2.0:Poe平台调用量21次,4K版本存在
3. 语音合成(TTS)领域
- ElevenLabs:市场主导(占比80%)
- 其他竞争者:Unreal Speech、Cartesia、PlayAI
关键数据洞察
- 市场格局:语言模型呈现OpenAI(10%)、Google(5%)、Anthropic(10%)三足鼎立,DeepSeek在Poe平台表现突出(12%)
- 轻量化趋势:各厂商均推出mini/light版本(如o3-mini、Grok-3-mini)
- 图像生成成本:FLUX模型成本效益突出(35单位产出/4单位投入)
- 新兴领域:视频生成工具Runway产能最高(40单位),但Google Veo 2可能更高效(20单位/2成本)
时间线观察
- 2024-2025年出现明显版本迭代:
- OpenAI从o1-preview发展到o4-mini
- Gemini从2.0升级至2.5 Pro
- Claude从3.5升级到3.7
特殊发现
- Poe平台成为多模型聚合入口,承载OpenAI、DeepSeek、Claude等主流模型
- "TTS"领域出现技术垄断迹象(ElevenLabs占80%份额)
- 中国厂商DeepSeek在特定平台表现亮眼(Poe平台12%占比)