阶跃发布并开源生产级高效率Agent模型Step 3.7 Flash

2026-05-29 11:24:52
分享
AIME

问财摘要

1、基础大模型创业公司阶跃星辰(StepFun)发布并开源Step3.7Flash模型。这是一款专为生产级Agent打造的Flash模型,官方称其致力于在速度、成本、可靠执行和复杂任务处理能力之间实现更好平衡。 2、模型针对生产级Agent场景需求优化了关键能力:原生多模态理解与执行、联网与视觉搜索增强、高可靠工具调用与编排及Agent生态兼容优化。 3、基准测试显示,Step3.7Flash在多项复杂视觉任务Benchmark上,展现出媲美更大规模旗舰模型的能力表现。
免责声明 内容由AI生成
文章提及标的
Benchmark--

上证报中国证券网讯(记者孙小程)5月29日,基础大模型创业公司阶跃星辰(StepFun)发布并开源Step3.7Flash模型。这是一款专为生产级Agent打造的Flash模型,官方称其致力于在速度、成本、可靠执行和复杂任务处理能力之间实现更好平衡。

Step3.7Flash采用稀疏MoE架构,总参数196B+1.8B(ViT)、激活参数仅11B,最高生成速度可达400Tokens/s,特别适合高频、多轮的Agent应用场景,能显著提升任务完成效率。模型针对生产级Agent场景需求优化了关键能力:原生多模态理解与执行、联网与视觉搜索增强、高可靠工具调用与编排及Agent生态兼容优化。

基准测试显示,Step3.7Flash在SimpleVQA(Search)、V*(Python)等复杂视觉任务Benchmark(BHE)上,展现出媲美更大规模旗舰模型的能力表现。而在考察多工具协同的Toolathlon上,这款模型的分值达到49.5%,并在考察真实环境下日常自主任务执行的ClawEval-1.1上达到67.1%;在横跨44种职业的GDPval上达到45.8%;在τ-bench Telecom的低、中、高三档推理难度下通过率均达到98%以上。

这意味着,它能在多轮Agent工作流中稳定调用API、浏览器、终端、Office和外部系统,保持任务轨迹一致,降低跑偏和执行失败的可能性。

免责声明:风险提示:本文内容仅供参考,不代表同花顺观点。同花顺各类信息服务基于人工智能算法,如有出入请以证监会指定上市公司信息披露平台为准。如有投资者据此操作,风险自担,同花顺对此不承担任何责任。
homeBack返回首页
不良信息举报与个人信息保护咨询专线:10100571违法和不良信息涉企侵权举报涉算法推荐举报专区涉青少年不良信息举报专区

浙江同花顺互联信息技术有限公司版权所有

网站备案号:浙ICP备18032105号-4
证券投资咨询服务提供:浙江同花顺云软件有限公司 (中国证监会核发证书编号:ZX0050)
AIME
举报举报
反馈反馈