万亿参数模型「Ling-1T」正式上架华为云,昇腾AI云服务释放澎湃算力

来源: 华为官微

  近日,备受瞩目的万亿参数大模型Ling-1T正式上架华为云大模型即服务MaaS平台,Ling-1T是百灵大模型系列的首款旗舰级“非思考”模型,拥有万亿参数,并已开源。此次模型上架支持专属资源部署,依托华为云领先的AI算力基础设施,全面释放Ling-1T模型卓越能力。

   Ling-1T是一款拥有万亿级总参数的非思考模型,作为百灵大模型Ling2.0系列的旗舰力作,其每个token可激活约50B参数。模型基于先进的Ling2.0架构,在超过20T tokens的高质量、高推理浓度语料上完成预训练,并支持高达128K的上下文窗口。

  通过创新的“中训练+后训练”演进式思维链(Evo-CoT)技术,Ling-1T在多项国际权威的复杂推理基准测试中,如代码生成、软件开发、专业数学及逻辑推理等,均取得了业界顶尖(SOTA)的表现,Ling-1T在有限输出token条件下,于多项复杂推理基准中取得SOTA表现,展示出模型兼顾推理效率与准确性。

   Ling-1T模型与CloudMatrix384超节点在架构、性能和部署上存在高度互补。Ling-1T作为高效推理的模型,可充分利用CloudMatrix384超节点为大规模MoE模型提供的加速和优化,在实际应用中发挥出更强的性能。

   MoE架构与全对等互联:Ling-1T模型采用MoE(混合专家)架构。MoE模型的核心在于稀疏激活机制,分布式部署时会产生大量All-to-All通信需求,而传统网络架构难以高效处理。CloudMatrix384超节点通过全对等互连架构,高度契合MoE模型的通信密集型需求,有效避免通信瓶颈。

  专家并行与动态负载均衡:Ling-1T模型由256个专家模块组成,模型推理时需激活约50B参数,推理过程会产生大量网络通信。CloudMatrix384超节点通过超高速互联网络与基于内存语义的零拷贝数据聚合技术,有效突破大规模专家并行计算中的通信瓶颈,为超大规模语言模型推理提供高可靠、低延迟的端到端算力支持,从而在超节点上实现Ling-1T的高吞吐量和低延迟推理任务。

  华为云大模型即服务MaaS平台已预置DeepSeek、Qwen3、Kimi等业界主流开源大模型,并基于昇腾AI云服务完成深度适配与优化,模型部署和运行在云端,无需自行处理复杂的硬件和部署问题,用户可通过API接口可快速调用LLM、多模态等模型服务。Ling-1T作为新的旗舰模型入驻,将为用户提供更强大、多样化的大模型选择。

  即刻开始体验

  第一步

   PC端通过以下地址,访问大模型服务平台控制台:

   https://console.huaweicloud.com/modelarts/?region=cn-southwest-2#/model-studio/square

  第二步

  【模型广场】筛选Ling模型系列,选择Ling-1T模型进行模型部署

关注同花顺财经(ths518),获取更多机会

0

+1
  • 北信源
  • 兆易创新
  • 科森科技
  • 卓翼科技
  • 天融信
  • 吉视传媒
  • 御银股份
  • 中油资本
  • 代码|股票名称 最新 涨跌幅