韩国“国产大模型”陷入信任危机:技术自主之路有多难?
事件概述
2026年1月14日,据《华尔街日报》报道,韩国政府资助的“国产大模型竞赛”陷入争议。在五家入围决赛的企业中,至少有三家被指控使用了来自中国和美国公司的开源代码,涉及智谱AI、阿里巴巴、OpenAI和深度求索(DeepSeek)等公司。这引发了关于“国产AI是否真正自主”的激烈辩论。
项目背景与目标
- 启动时间:2024年6月。
- 核心目标:在三年内打造一个性能达到国际领先模型95%的“纯韩国技术”大模型。
- 战略意图:减少对中美科技巨头的依赖,确保国家经济与安全利益。
- 奖励机制:优胜者将获得政府提供的高质量数据、人才、资金以及关键AI芯片使用权。
争议焦点与各方回应
1. 主要涉事企业及指控
-
Upstage:
- 指控:被Sionic AI CEO 高锡贤公开指控其模型部分代码与智谱AI的开源代码高度相似,甚至保留了版权标记,被质疑是“伪装的中国模型申请纳税人资金”。
- 回应:召开直播新闻发布会,展示完整的训练日志以证明其核心模型为自主研发,并解释仅在推理框架中使用了全球广泛采用的智谱开源组件(非训练核心)。高锡贤随后道歉,但舆论风波已起。
-
Naver:
- 指控:被指其视觉和音频编码器与阿里巴巴的通义千问及OpenAI的产品相似。
- 回应:强调其核心训练引擎完全自研,外部组件仅用于标准化的输入/输出处理,此为行业常见做法。
-
SK Telecom:
- 指控:被发现在推理代码上与深度求索的开源库相似。
- 回应:同样声明核心训练过程为自主研发,外部代码用于通用处理环节。
2. 学术界观点分歧
-
支持使用开源:
- 哈佛大学教授 Wei Yu Yan 指出:“拒绝开源软件意味着放弃技术红利。独立开发每一行代码既不现实,也无必要。”
- 首尔大学AI研究所所长 Lee Jae-mo 证实,被质疑模型的核心参数训练过程确实是从零开始,并未直接复制外国模型的权重。
-
担忧与反对:
- 反对者担心,即使仅使用外围代码,也可能引入潜在的后门或依赖风险,从而削弱“主权AI”的战略意义。
政府态度与行业反思
- 官方回应:韩国科学部尚未在竞赛规则中对外国开源代码的使用做出明确定义。但部长裴敬勋表示欢迎技术辩论,称“这正是韩国AI的光明未来”。
- 深层挑战:此次争议折射出在全球AI生态高度互联的背景下,实现真正“技术独立”的边界难以界定。是追求代码的逐行自研,还是掌控核心算法与数据主权?这没有简单答案。
- 全球启示:此事为世界各国敲响了警钟——AI自主远不止是一场模型竞赛,而是涵盖技术伦理、产业政策与全球协作的系统性工程。
事件核心数据与要点
- 时间:2026年1月14日被曝出。
- 涉及国家:代码来源主要为中国和美国。
- 项目周期:3年(自2024年6月起)。
- 性能目标:达到国际领先模型的95%。
- 争议本质:在全球化开源协作成为行业标准的今天,追求“从零开始”的绝对技术自主是否现实且必要?
- 关键矛盾:技术全球化红利与国家安全、产业自主战略之间的平衡。
