商汤涨幅扩大至超25%,大模型日日新5.0版本性能超越GPT-4 Turbo,文生视频生成平台首次亮相

2024-04-24 10:05:38 来源: 金融界

  4月24日消息商汤涨幅扩大至超25%,最新报0.74港元,涨幅21.31%。商汤科技昨日发布日日新5.0大模型,采用MOE混合专家架构,基于超过10TB tokens训练,大量合成数据,推理上下文窗口200K,强调知识、推理、数学、代码能力可达到或超越GPT-4。

  商汤科技表示,这是行业内首个“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求。公司技术领跑加速生成式AI向产业落地的全面跃迁,实现大模型按需所取。商汤科技董事长兼CEO徐立表示,在尺度定律(Scaling Law)的准则下,商汤持续推动自身大模型研发,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。

  昨日在技术交流日活动现场,商汤原创打造的文生视频生成平台首次亮相,聚焦为用户提供可控的文生视频创作体验。徐立展示了三段完全由大模型生成的视频片段,充分展现了商汤文生视频技术对人物、动作和场景的高度可控性。

  去年4月10日,商汤首次公布“日日新SenseNova”大模型体系,以及自研的中文语言大模型应用平台“商量”,参数量达千亿,可实现文本生成、图像生成、多模态内容生成等能力与场景应用。

  2023年7月、8月以及今年1月,日日新大模型升级到2.0、3.0版本以及日日新V4.0,“商量”2.0和小模型商量S版(SenseChat S)等不同参数量级模型版本页同时发布,可适配移动端等不同终端及场景的应用需求。新的日日新V4.0通过提高训练数据的质量以及实现基础语言能力的显著提升,在代码编写、数据分析、医疗问答等多个场景中达到与GPT-4相匹配的能力,同时还开源对应7B和20B的两种参数基模型。

  最新2023年报显示,去年基于商汤生成式AI收入达到12亿元人民币,实现200%的飞速增长;同时,商汤大模型基础设施大装置SenseCore总算力规模突破性增长至12000petaFLOPS,运营GPU数量达4.5万卡,其中国产算力2000P,已完成58款国产芯片适配和应用;另外,生成式AI业务中超过70%的客户在过去12个月内是商汤的新客户,剩下30%的存量客户的客单价也录得约50%的增速,截至3月,订单金额超过千万人民币的客户数已达到数十家,日日新赋能C端的调用量实现近120倍的增长。

关注同花顺财经(ths518),获取更多机会

0

+1
  • 川宁生物
  • 蔚蓝生物
  • 鲁抗医药
  • 中海达
  • 国联股份
  • 凯中精密
  • 凌云股份
  • 溢多利
  • 代码|股票名称 最新 涨跌幅