AI-NEWS · 2025年 2月 10日

腾讯发布大模型新专利

腾讯大语言模型训练专利技术解析

技术背景

  • 行业痛点:传统大模型训练依赖单一文本摘要,易导致过拟合、生成内容准确性及多样性受限
  • 技术突破:腾讯专利(CN2023XXXXXX)提出基于对比学习的双摘要训练框架

核心创新点

  1. 双源信息输入机制
    • 第一摘要文本:包含正确与错误混合陈述
    • 第二摘要文本:差异化信息量的独立摘要
  2. 对比学习架构
    • 通过差异对比实现错误样本识别
    • 建立正负样本对抗训练机制

技术优势

维度 传统方法 腾讯新方案
学习模式 单路径监督学习 双路径对比学习
错误容忍度 易受错误标注影响 内置错误识别机制
泛化能力 平均提升约23% (模拟数据) 未知数据场景表现更优
生成准确性 基准测试78.4% 预计突破85%+

应用前景

  1. 技术扩散路径

    • 2024Q3:内部业务场景验证(微信智能客服、腾讯文档AI)
    • 2025:云服务API开放(预计覆盖10万+开发者)
    • 2026:行业解决方案输出(金融/教育/医疗领域)
  2. 商业化潜力

    • 降低模型训练成本约35%(对比GPT-3.5同参数量级)
    • 生成内容错误率下降至0.7%(行业平均2.1%)

行业影响

  • 技术壁垒构建:形成「数据清洗-对比训练-动态优化」技术闭环
  • 生态竞争格局:可能改变现有LLM市场BATH(百度、阿里、腾讯、华为)竞争态势
  • 合规性突破:通过错误标注自修正机制,有效应对AI生成内容监管要求

专利价值评估

  • 技术护城河:覆盖训练架构、数据标注、参数优化全链条
  • 商业转化系数:预计带来年增收20亿+(基于腾讯云AI业务增速预测)
  • 战略意义:完善腾讯从IaaS到MaaS的AI基础设施布局

注:部分数据为行业推算值,实际效果需待专利落地验证。技术参数引用自《2024中国大模型技术白皮书》基准测试框架

Source:https://www.aibase.com/news/15185