NVIDIA 推出 Nemotron 3 系列开放模型
Nemotron3系列开放模型包含Nano、Super和Ultra三种规模,具有极高的效率和领先的精度,适用于代理式AI应用开发。
Nemotron3Nano的吞吐量比Nemotron2Nano高4倍,并通过突破性的异构混合专家(Hybrid Mixture-of-Experts)架构,在大规模多智能体系统中实现了领先的每秒生成token数。
Nemotron通过先进的强化学习技术以及大规模并行多环境后训练,实现了卓越的准确率。
NVIDIA率先推出整套前沿的开放模型、训练数据集及强化学习环境与库,助力构建高精度、高效的专业AI智能体。
NVIDIA于12月15日宣布推出NVIDIA Nemotron3 系列开放模型、数据和库,为各个行业透明、高效的专业代理式AI开发提供助力。
Nemotron3模型提供Nano、Super和Ultra三种规模,采用突破性的异构潜在混合专家(MoE)架构,帮助开发者大规模开发并部署可靠的多智能体系统。
随着企业从单模型对话机器人转向协作式多智能体AI系统,开发者面临着日益严峻的挑战,包括通信开销、上下文漂移和高推理成本等。此外,开发者需要模型具备透明度,才能信任其用于自动化复杂工作流。Nemotron3直面这些挑战,为用户提供开发专业化代理式AI所需的性能与开放性。
NVIDIA创始人兼首席执行官黄仁勋表示:“开放创新是AI进步的基础。通过Nemotron,我们将先进AI转化成开放平台,为开发者提供构建大规模代理式系统所需的透明度与效率。”
NVIDIA 还发布了面向专业AI智能体开发者的训练数据集与前沿强化学习库集合。
全新Nemotron预训练、后训练及强化学习数据集,为开发高性能特定领域智能体提供了丰富的推理、编码及多步骤工作流范例。
0人