AI-NEWS · 2025年 2月 10日

腾讯申大模型训练专利

腾讯大语言模型训练专利分析

1. 专利核心内容

专利名称：大语言模型的训练方法、装置、计算机设备及存储介质
申请方：腾讯科技（深圳）有限公司
核心创新：通过引入第一摘要文本（含正确与错误信息）和第二摘要文本（信息量不同），优化模型训练过程。

2. 技术实现逻辑

对比学习机制：
- 第一摘要文本包含混合信息（正确与错误陈述），第二摘要文本提供差异化内容。
- 模型通过对比同一文本的两种摘要，学习区分正误，避免单一摘要导致的过拟合或生成偏差。
训练优化：
- 动态调整学习目标，增强模型对复杂语义的理解能力。

3. 技术优势

性能提升：
- 泛化能力：通过多样化摘要内容，减少对特定数据模式的依赖。
- 准确性：对比学习机制显著提高生成结果的可靠性。
问题规避：
- 解决传统单一摘要训练中常见的过拟合、生成内容不精准等问题。

4. 行业意义

技术突破：为大规模语言模型训练提供更高效的框架，可能推动AI生成内容（AIGC）领域的精度提升。
应用场景：可扩展至对话系统、文本生成、知识推理等场景，强化模型对复杂任务的适应性。

5. 数据与趋势

专利未披露具体实验数据，但强调“显著提升”效果，推测其可能通过多轮对比测试验证性能（如损失函数收敛速度、生成文本的BLEU评分等）。
腾讯此举或为巩固其在AI底层技术领域的布局，与国内外大模型研发竞争形成差异化优势。

https://www.aibase.com/news/15195

您可能还喜欢...