百度文心新模型ERNIE-4.5-21B-A3B-Thinking登顶Hugging Face排行榜

核心规格与创新设计

百度文心大模型家族近期迎来重大升级——ERNIE-4.5-21B-A3B-Thinking正式开源，并迅速登顶Hugging Face平台文本生成模型排名，同时在整体模型榜单中位列第三。这款轻量级混合专家（MoE）模型凭借出色的推理能力和参数效率引发行业广泛关注，标志着中国AI开源生态的又一里程碑。

该模型采用先进的MoE架构，总参数量为21B，但每个token仅激活3B参数。这种稀疏激活机制在保持高性能输出的同时显著降低计算成本。模型支持128K长上下文窗口，特别适合处理逻辑推理、数学解题和学术分析等复杂长文本任务。

与依赖PyTorch框架的主流模型不同，ERNIE-4.5系列基于百度自研的PaddlePaddle深度学习框架进行训练和优化。这种独立框架设计不仅增强了模型在多模态任务中的兼容性，还确保了高效的硬件适配。目前全球仅百度和谷歌使用自研框架训练大模型，凸显了其技术自主性和创新深度。

性能表现：高效推理挑战行业巨头

根据最新基准测试，该模型在逻辑推理、数学、科学、编码和文本生成等任务中表现优异，部分指标甚至接近或超越Gemini 2.5 Pro和GPT-5级别的模型。尽管总参数量仅为21B（约为Qwen3-30B的70%），其在BBH和CMATH等数学推理基准测试中的得分已超越竞品，展现出极高的参数效率。

此外，模型包含高效工具调用功能，支持结构化函数调用和外部API集成，适用于程序合成、符号推理和多智能体工作流场景。在长上下文理解方面，经过专门训练后能稳定处理海量信息生成学术级合成内容，显著减少幻觉问题。模型还支持中英双语优化，适合全球开发者和企业应用。

开源社区反馈显示，该模型在Hugging Face上的下载量和趋势指数大幅飙升，成为文本生成领域的热门选择。开发者可使用vLLM、Transformers 4.54和FastDeploy等工具轻松集成，实现本地部署或云端推理。

开源意义：推动AI民主化与生态发展

ERNIE-4.5-21B-A3B-Thinking采用Apache 2.0许可证发布，支持商业使用，进一步降低AI技术门槛。继6月底文心4.5家族其他10款模型开源后，此次发布强化了百度在开源AI领域的领导地位。目前Hugging Face平台上众多顶级模型均为中国开源成果，反映出中国在MoE架构和推理优化方面的全球竞争力。

作为文心大模型的最新迭代，该模型不仅提升了指令遵循和知识密集型任务的表现，还通过多轮强化学习增强"思考"模式。在视觉-语言任务中，其VL变体同样表现优异，在MathVista和MMMU等基准测试中缩小了与OpenAI-o1的差距。

行业影响与未来展望

该模型的发布证明，无需万亿级密集参数也能实现深度推理。它为资源有限的开发者提供了高性能选择，推动AI从实验室向实际应用转化。未来随着PaddlePaddle框架生态持续扩展，文心系列有望在智能体产品和多模态应用中发挥更大作用，避免单一厂商垄断带来的风险。

其他AI领域动态（2025年9月15日）

xAI推出Grok 4 Fast：响应速度提升十倍，但在细节处理上有所妥协
Genspark AI浏览器发布：支持本地运行169个开源模型，包括GPT-OSS和Gemma3
小红书发布FireRedTTS-2：新一代对话合成模型，助力AI播客制作
上海加速AI医疗设备应用：推动高端产业链发展
蚂蚁集团发布AI开源全景图2.0：涵盖114个项目，揭示三大技术转型趋势
Cursor升级Tab模型：实时强化学习提升开发者建议准确率，建议数量减少21%，接受率提高28%
OpenAI调整微软分成比例：计划将微软分成从20%降至8%，预计增加500亿美元收入

火龙果频道

近期新闻

AI-NEWS · 2025年 9月 16日

百度文心模型登顶

百度文心新模型ERNIE-4.5-21B-A3B-Thinking登顶Hugging Face排行榜

核心规格与创新设计

性能表现：高效推理挑战行业巨头

开源意义：推动AI民主化与生态发展

行业影响与未来展望

其他AI领域动态（2025年9月15日）

您可能还喜欢...

AI-NEWS · 2025年 9月 16日

百度文心新模型ERNIE-4.5-21B-A3B-Thinking登顶Hugging Face排行榜

核心规格与创新设计

性能表现：高效推理挑战行业巨头

开源意义：推动AI民主化与生态发展

行业影响与未来展望

其他AI领域动态（2025年9月15日）

您可能还喜欢...

Pindrop Launches AI Audio Forgery Detection Tool Pulse Inspect with 99% Accuracy

无代码也能当导演

苹果发布极速视觉模型