AI-NEWS · 2024年 7月 8日

商汤科技发布“日日新5o”:对标GPT-4o 实现实时流式多模态交互

商汤科技发布“日日新5o”模型:对标GPT-4o,实时流式多模态交互

关键点总结:

  1. 发布背景和场合

    • 在2024年世界人工智能大会上发布。
  2. 核心功能与特性

    • 国内首个所见即所得模型。
    • 实现了实时流式多模态交互,包括声音、文本、图像和视频的综合处理。
    • 能够进行实时理解和响应,例如识别胸卡、描述玩偶外观以及即时评价图画等。
  3. 技术优势

    • 适用于实时对话和语音识别。
    • 能在同一模型中处理多种任务,并自适应调整行为和输出。
    • 基于“日日新5.5”基础模型,相较“日日新5.0”,综合性能提升30%,特别是在数学推理、英文能力和指令跟随方面有显著提升。
  4. 模型训练与架构

    • “日日新5.5”采用混合端云协同专家架构。
    • 使用超过10TB高质量训练数据,包括合成的思维链数据,提升推理思维能力。
  5. 市场推广策略

    • 推出“大模型0元Go”计划,降低企业用户接入门槛。
    • 为新注册用户提供多项免费服务及5000万Tokens包。
    • 提供专属搬家顾问帮助OpenAI用户迁移,实现零服务成本。

数据与分析:

  • 技术升级

    • 综合性能提升了30%,特别是在重要领域如数学推理、英文能力和指令跟随方面,这意味着模型的应用范围和准确性大幅提高。
  • 数据量

    • 超过10TB的高质量训练数据表明商汤在数据积累和模型训练上的投入巨大,强化了其在推理和多模态处理上的优势。
  • 市场策略

    • “大模型0元Go”计划的推出和赠送5000万Tokens包,以及提供搬家顾问服务,显示出商汤科技在降低用户转换成本和增强用户粘性上的努力,有助于迅速扩大市场份额。

深度观点:

商汤科技通过发布“日日新5o”展示了其在多模态人工智能交互领域的领先地位。相比之前的版本,该模型在综合性能上有显著提升,尤其在关键技术指标如数学推理和指令跟随能力方面。这不仅提升了模型的实用性,还为企业级用户提供了更强大的工具。同时,通过“大模型0元Go”计划,商汤科技在用户获取和市场推广上也做出了精准布局,降低了用户的试用门槛,有望快速占领市场并增强用户粘性。总体而言,“日日新5o”的发布标志着商汤科技在AI领域的一个重要里程碑,可能引领国内外市场的进一步发展。

Source:https://www.aibase.com/news/10052