AI-NEWS · 2026年 1月 15日

谷歌重金投资医疗AI开源生态

Google 加码医疗AI开源生态：发布MedGemma 1.5与MedASR模型

发布日期：2026年1月14日
核心事件：Google 近期正式发布了新一代开源医疗大模型 MedGemma 1.5，并同步推出了专为临床场景设计的开源语音识别模型 MedASR，此举旨在进一步丰富其在医疗垂直领域的技术栈。

模型核心升级与功能

MedGemma 1.5：从文本工具到多模态临床支持系统

定位：作为Gemma系列的医疗专用版本。
核心升级：相比前代，其医学影像理解和分析能力显著增强。
功能范围：
- 处理文本病历、检验报告和医学文献。
- 结合X光、CT等常见影像模态的描述性数据。
角色转变：该升级使MedGemma从一个纯文本问答工具，转变为多模态临床决策支持系统，更贴合真实的医疗工作流程。

MedASR：瞄准临床语音场景，减轻文书负担

解决痛点：针对医生文书负担重的痛点。
功能特点：
- 针对医疗语音场景优化。
- 能准确识别医患对话、查房、手术记录等专业内容。
- 可自动转录为结构化文本，大幅提升电子病历录入效率。
数据与合规：Google强调，两个模型均基于去标识化的临床数据训练，严格遵守隐私保护法规。

战略意义与行业影响

战略深化：此次双模型发布标志着Google在医疗AI领域的战略深化，从“封闭服务”转向“开放赋能”。
降低创新门槛：继Gemini医疗助手获得HIPAA合规认证后，开源模型的发布将进一步降低医疗机构、初创公司和学术团队的创新壁垒。
推动应用普及：有望促进AI在基层医疗、远程诊断、科研分析等场景的普及应用。
生态构建：在AI医疗从“可用”走向“好用”的关键阶段，Google正通过开源、合规与多模态结合的方式，构建安全、实用、可扩展的医疗AI生态基础。

总结

Google通过发布MedGemma 1.5和MedASR，不仅提升了自身在医疗AI多模态分析（尤其是影像）和临床语音处理方面的技术能力，更以开源形式向全球研究者和开发者开放，旨在推动整个医疗AI行业的创新与应用落地。

火龙果频道

您可能还喜欢...