百川智能发布M3 Plus模型，刷新医疗大模型可靠性与应用成本纪录

2026年1月22日，百川智能在“百川-M3Plus模型发布媒体沟通会”上，正式发布了升级版医疗大模型百川-M3Plus（简称M3Plus）。此次发布距离其新一代医疗模型Baichuan-M3开源仅9天，是一次重要的快速迭代。

核心性能提升：幻觉率显著降低

官方数据显示，M3Plus在医疗问答的准确性与可靠性上实现了进一步突破，创下了行业低幻觉性能的新纪录。

关键指标对比：在幻觉率评估中，M3Plus的幻觉率从M3版本的3.5降至2.6，降幅明显。
横向对比优势：据称，其事实幻觉率比GPT-5.2低30%以上，显著提升了医疗AI的临床可信度。
技术内核：该模型专为高可靠性医疗场景设计，将“六源循证范式”融入全训练与推理流程，确保诊断建议与用药警示均基于权威医学证据。

现场实测表现优异

在发布会现场的实测环节，百川智能将M3Plus与多款国内主流医疗模型产品进行了对比测试。结果显示：

部分同类产品仍存在参考文献来源不清、专业表述易引发误解等问题。
集成M3Plus的应用“白晓英”则能提供更精准、清晰的答案，表现突出。

应用成本大幅降低

除性能提升外，M3Plus在成本控制上也取得突破。

API调用成本大幅下降：相比前代，降低了70%。
行业影响：此举有效降低了使用门槛，为后续大规模部署与推广提供了有力支持。

其他AI领域动态摘要（同日）

曦威科技融资：国内AI推理GPU芯片创业公司曦威科技，在一年内完成近30亿元融资，创下中国AI芯片领域早期融资纪录。投资方包括产业资本、头部VC/PE及国家级基金。
国产算力突破：摩尔线程与硅基流动成功将6710亿参数的DeepSeek V3模型适配至国产GPU MTT S5000。采用FP8低精度推理，实现了超过4000 tokens/秒的预填充和超过1000 tokens/秒的解码吞吐，性能接近国际高端AI加速器水平。
天猫AI图像鉴伪：淘宝与天猫推出新的AI图像鉴伪模型。
特斯拉Dojo 3转向：特斯拉重启Dojo 3项目，战略重心从自动驾驶转向太空AI计算，计划在轨道部署计算中心。
阶跃星辰开源模型：开源多模态视觉语言模型Step3-VL-10B，仅100亿参数却在多项基准测试中表现出色，甚至在部分任务上挑战了参数量大10-20倍的旗舰模型。
智谱AI开源新模型：开源GLM-4.7-Flash模型，这是一个300亿激活参数的MoE模型，在多项测试中表现优于阿里与OpenAI的同规格模型。
微软Copilot PC性能宣称：微软内部测试称其高端Copilot PC在多核性能上已超越苹果M4 MacBook Air。
谷歌Gemini集成搜索：谷歌将Gemini 3 Pro模型深度集成至搜索引擎的AI Overview功能，以处理复杂的脑力密集型查询。
腾讯混元3D Studio升级：腾讯混元3D Studio 1.2版本启动公测，引入新的笔刷交互与八视图生成功能，使3D建模更精准。

本文信息整理自AIbase Daily 2026年1月22日的报道。

火龙果频道

近期新闻

AI-NEWS · 2026年 1月 23日

百川智能发布M3 Plus

百川智能发布M3 Plus模型，刷新医疗大模型可靠性与应用成本纪录

核心性能提升：幻觉率显著降低

现场实测表现优异

应用成本大幅降低

其他AI领域动态摘要（同日）

您可能还喜欢...

AI-NEWS · 2026年 1月 23日

百川智能发布M3 Plus模型，刷新医疗大模型可靠性与应用成本纪录

核心性能提升：幻觉率显著降低

现场实测表现优异

应用成本大幅降低

其他AI领域动态摘要（同日）

您可能还喜欢...

月之暗面与清华：大模型推理的新解法

通义千问APP视频功能升级

xAI推出独立应用Grok挑战ChatGPT