AI-NEWS · 2025年 2月 10日

腾讯申大模型训练专利

腾讯大语言模型训练专利分析

1. 专利核心内容

  • 专利名称:大语言模型的训练方法、装置、计算机设备及存储介质
  • 申请方:腾讯科技(深圳)有限公司
  • 核心创新:通过引入第一摘要文本(含正确与错误信息)和第二摘要文本(信息量不同),优化模型训练过程。

2. 技术实现逻辑

  • 对比学习机制
    • 第一摘要文本包含混合信息(正确与错误陈述),第二摘要文本提供差异化内容。
    • 模型通过对比同一文本的两种摘要,学习区分正误,避免单一摘要导致的过拟合或生成偏差。
  • 训练优化
    • 动态调整学习目标,增强模型对复杂语义的理解能力。

3. 技术优势

  • 性能提升
    • 泛化能力:通过多样化摘要内容,减少对特定数据模式的依赖。
    • 准确性:对比学习机制显著提高生成结果的可靠性。
  • 问题规避
    • 解决传统单一摘要训练中常见的过拟合、生成内容不精准等问题。

4. 行业意义

  • 技术突破:为大规模语言模型训练提供更高效的框架,可能推动AI生成内容(AIGC)领域的精度提升。
  • 应用场景:可扩展至对话系统、文本生成、知识推理等场景,强化模型对复杂任务的适应性。

5. 数据与趋势

  • 专利未披露具体实验数据,但强调“显著提升”效果,推测其可能通过多轮对比测试验证性能(如损失函数收敛速度、生成文本的BLEU评分等)。
  • 腾讯此举或为巩固其在AI底层技术领域的布局,与国内外大模型研发竞争形成差异化优势。

https://www.aibase.com/news/15195