Quark发布健康大模型技术报告,公开AI主任医师技术细节
核心突破
2025年8月25日,夸克正式发布健康大模型技术报告《QuarkMed技术报告》,首次披露"主任医师级"能力的技术实现细节。
此前,夸克健康大模型成功通过中国12个核心医学学科的笔试考核评估,成为国内首个完成此项挑战的大模型。与通用模型相比,夸克健康大模型呈现出"难度越高优势越明显"的性能曲线,特别是在复杂医学推理任务上实现突破。
技术实现路径
数据训练策略
面对医学模型对高质量、高专业性训练数据的需求,夸克健康大模型在模型训练的不同阶段使用了三类核心医学数据:
- 医学文献:专业医学文档资料
- 医学知识:结构化医学知识体系
- 病历数据:临床实践记录
总数据量达到约1万亿Tokens,这些专业数据有效弥补了预训练语料的不足,提升了模型的准确性和推理能力。
强化学习优化
为提升模型的正确性、安全性和复杂推理能力,引入了两个强化学习(RL)阶段:
- 第一阶段:通过大规模医学强化学习,提升模型在复杂场景下的推理能力
- 第二阶段:设计奖励模型,从三个维度评估模型输出质量:
- 诚实性(Honesty)
- 有用性(Usefulness)
- 内容合规性(Content Compliance)
通过调整模型行为,使其与人类偏好和价值观对齐。
性能表现
国际权威测试
在MedQA等国际权威数据集上,夸克健康大模型相比o3-mini等同等规模模型展现出更优性能。
国内医师资格考试
在中国医师资格考试(CPQExam)笔试评估中,呈现出"难度越高优势越明显"的特点,在高级别医学推理任务中表现突出。
开放计划
夸克计划全面开放医师考试测试集,以促进医学相关AI研究的发展。
技术报告获取地址:QuackHealthLargeModel