[TechWeb]9月11日消息,在9日举办的WAVESUMMIT深度学习开发者大会2025现场,百度开源最新的思考模型ERNIE-4.5-21B-A3B-Thinking。
据HuggingFace官网数据,截至2025年9月11日,百度最新开源的文心思考模型ERNIE-4.5-21B-A3B-Thinking,在HuggingFace文本模型趋势榜上排名第一,模型总榜排名第三。
ERNIE-4.5-21B-A3B-Thinking采用了混合专家(MoE)架构,总参数规模达21B,每个token激活3B参数,通过指令微调及强化学习训练。ERNIE-4.5-21B-A3B-Thinking是在ERNIE-4.5-21B-A3B基础上训练的深度思考模型,支持128K的上下文窗口,适用于需要长上下文的复杂推理任务。该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。
ERNIE-4.5-21B-A3B-Thinking作为一款21B总参数量,激活仅3B的轻量级模型,在各项测试中的表现紧追业界顶级大尺寸模型,以轻量级规模实现了接近SOTA的智能表现。