AI-NEWS · 2024年 12月 31日

doubtedao大模型首次展现处理300万字符文本能力,媲美GPT-4 简化后不超过10个字的标题: doubeko模型挑战GPT-4

字节跳动DouBao大模型技术进展报告分析

主要发现

  • 性能提升:字节跳动的DouBao大模型最新版本Doubao-pro-1215在综合性能上已与GPT-4齐平,并在某些专业领域展现出更强的能力。自今年5月首次亮相以来,仅用7个月时间,其能力提升了32个单位。

  • 技术优化:通过大规模数据处理的优化和创新模型架构(包括增加模型稀疏度和引入强化学习技术),Doubao在理解准确性和生成质量方面取得了显著进步。特别地,在数学和专业知识等复杂场景中,其表现甚至超越了GPT-4。

  • 成本优势:尽管性能强大,DouBao的服务价格仅为GPT-4的八分之一。

技术突破

  • 超长文本处理能力:DouBao能够处理300万字符的超长文本,相当于同时处理“数百份学术报告”。通过使用相关上下文数据算法(如STRING)和优化稀疏化及分布方案,其在处理数百万token时保持了15秒以内的处理延迟,显著提高了模型在外部知识处理方面的效率。

意义

  • 中国AI技术的发展:这项技术突破不仅展示了中国人工智能技术的快速发展,还表明由于更好的成本效益,大型模型的广泛应用可能会加速。

Source:https://www.aibase.com/news/14382