百度开源ERNIE-4.5-21B-A3B-Thinking:轻量化模型推理能力再升级

2025-09-10 20:53:32 来源: 经济参考网

  近日举行的WAVE SUMMIT深度学习开发者大会2025现场,百度正式开源最新的思考模型ERNIE-4.5-21B-A3B-Thinking。

  据介绍,ERNIE-4.5-21B-A3B-Thinking采用了混合专家(MoE)架构,总参数规模达210亿,每个token激活30亿参数,通过指令微调及强化学习训练。ERNIE-4.5-21B-A3B-Thinking是在ERNIE-4.5-21B-A3B基础上训练的深度思考模型,该模型支持128K的上下文窗口,适用于需要长上下文的复杂推理任务。该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。

   ERNIE-4.5-21B-A3B-Thinking模型以Apache License2.0协议开源,允许商业使用。该模型已在HuggingFace、星河社区等主流开源社区同步发布,FastDeploy、vLLM、Transformers等开源工具已经实现了对该模型的支持,可以直接加载模型并使用。其中,FastDeploy提供一键部署能力,支持单张加速卡运行,方便用户快速开展推理服务。

   ERNIE-4.5-21B-A3B-Thinking作为一款21B总参数量,激活仅3B的轻量级模型,在各项测试中的表现紧追业界顶级大尺寸模型,以轻量级规模实现了接近SOTA的智能表现。

  公开资料显示,6月30日,百度正式开源文心大模型4.5系列模型,涵盖47B、3B激活参数的混合专家(MoE)模型,与0.3B参数的稠密型模型等10款模型,并实现预训练权重和推理代码的完全开源。目前,文心开源系列模型已在行业中得到广泛应用。

  在WAVE SUMMIT深度学习开发者大会2025上,百度还正式发布文心大模型X1.1深度思考模型,该模型在事实性、指令遵循、智能体等能力上均有大幅提升。目前,用户可以在文心一言官网、文小言APP使用文心大模型X1.1。文心大模型X1.1已正式上线百度智能云千帆平台,对企业客户及开发者全面开放使用。(华柏)

关注同花顺财经(ths518),获取更多机会

0

+1
  • 北信源
  • 兆易创新
  • 科森科技
  • 卓翼科技
  • 天融信
  • 吉视传媒
  • 御银股份
  • 中油资本
  • 代码|股票名称 最新 涨跌幅