百川智能发布M3 Plus模型,刷新医疗大模型可靠性与应用成本纪录
2026年1月22日,百川智能在“百川-M3Plus模型发布媒体沟通会”上,正式发布了升级版医疗大模型百川-M3Plus(简称M3Plus)。此次发布距离其新一代医疗模型Baichuan-M3开源仅9天,是一次重要的快速迭代。
核心性能提升:幻觉率显著降低
官方数据显示,M3Plus在医疗问答的准确性与可靠性上实现了进一步突破,创下了行业低幻觉性能的新纪录。
- 关键指标对比:在幻觉率评估中,M3Plus的幻觉率从M3版本的3.5降至2.6,降幅明显。
- 横向对比优势:据称,其事实幻觉率比GPT-5.2低30%以上,显著提升了医疗AI的临床可信度。
- 技术内核:该模型专为高可靠性医疗场景设计,将“六源循证范式”融入全训练与推理流程,确保诊断建议与用药警示均基于权威医学证据。
现场实测表现优异
在发布会现场的实测环节,百川智能将M3Plus与多款国内主流医疗模型产品进行了对比测试。结果显示:
- 部分同类产品仍存在参考文献来源不清、专业表述易引发误解等问题。
- 集成M3Plus的应用“白晓英”则能提供更精准、清晰的答案,表现突出。
应用成本大幅降低
除性能提升外,M3Plus在成本控制上也取得突破。
- API调用成本大幅下降:相比前代,降低了70%。
- 行业影响:此举有效降低了使用门槛,为后续大规模部署与推广提供了有力支持。
其他AI领域动态摘要(同日)
- 曦威科技融资:国内AI推理GPU芯片创业公司曦威科技,在一年内完成近30亿元融资,创下中国AI芯片领域早期融资纪录。投资方包括产业资本、头部VC/PE及国家级基金。
- 国产算力突破:摩尔线程与硅基流动成功将6710亿参数的DeepSeek V3模型适配至国产GPU MTT S5000。采用FP8低精度推理,实现了超过4000 tokens/秒的预填充和超过1000 tokens/秒的解码吞吐,性能接近国际高端AI加速器水平。
- 天猫AI图像鉴伪:淘宝与天猫推出新的AI图像鉴伪模型。
- 特斯拉Dojo 3转向:特斯拉重启Dojo 3项目,战略重心从自动驾驶转向太空AI计算,计划在轨道部署计算中心。
- 阶跃星辰开源模型:开源多模态视觉语言模型Step3-VL-10B,仅100亿参数却在多项基准测试中表现出色,甚至在部分任务上挑战了参数量大10-20倍的旗舰模型。
- 智谱AI开源新模型:开源GLM-4.7-Flash模型,这是一个300亿激活参数的MoE模型,在多项测试中表现优于阿里与OpenAI的同规格模型。
- 微软Copilot PC性能宣称:微软内部测试称其高端Copilot PC在多核性能上已超越苹果M4 MacBook Air。
- 谷歌Gemini集成搜索:谷歌将Gemini 3 Pro模型深度集成至搜索引擎的AI Overview功能,以处理复杂的脑力密集型查询。
- 腾讯混元3D Studio升级:腾讯混元3D Studio 1.2版本启动公测,引入新的笔刷交互与八视图生成功能,使3D建模更精准。
本文信息整理自AIbase Daily 2026年1月22日的报道。
