豆包大模型2.0正式发布,API同步上线

来源: 火山引擎

  今天,火山引擎正式发布豆包大模型2.0系列。

  自推出豆包大模型以来,火山引擎大模型日均Tokens使用量已增长超500倍。围绕这些大规模生产环境下的使用需求,豆包大模型2.0(Doubao-Seed-2.0)做了系统性优化,依托高效推理、多模态理解、复杂指令执行等能力,能够更好地完成真实世界的复杂任务。

  同时,豆包大模型2.0提供了灵活的模型选择:包含 Pro、Lite、Mini 三款多模态通用模型,以及面向开发者的 Code 模型(Doubao-Seed-2.0-Code),以满足不同场景下企业和用户对延迟和成本的不同需求。

  其中,豆包大模型2.0 Pro 作为旗舰模型,适应复杂深度推理、Agent 等高难度任务;豆包大模型 2.0 Lite 则全面优于豆包大模型1.8,能力增强的同时对 Tokens 的消耗更少,是绝佳性价比之选;豆包大模型 2.0 Mini 以速度和成本优先,大部分能力媲美豆包大模型1.6 Pro;豆包大模型2.0 Code 则是编程任务的更优选择,与TRAE结合使用效果更佳。

  面向企业和开发者,火山引擎今天已上线豆包2.0系列模型 API 服务,个人用户可以在火山方舟体验中心或者打开豆包App「专家」模式体验,开发者还可以在 TRAE 中使用豆包大模型2.0。点击文末【阅读原文】即刻体验豆包2.0系列新模型。

  多模态理解能力全面升级

  空间和运动理解大幅提升

  豆包大模型2.0全面升级了多模态能力,在各类视觉理解任务上均达到业界顶尖水平,其视觉推理、感知能力、空间推理与长上下文理解能力表现尤为突出。

  在视觉理解方面,豆包大模型2.0 Pro 在空间理解 MMSIBench、运动理解 MotionBench、视频理解VideoMME 这几个测评集上,领先 Gemini 3 pro,在图表理解 CharXiv-RQ 上也再次大幅提升。

  面对视频场景,豆包大模型 2.0 强化了对时间序列与运动感知的理解能力,在 TVBench、TempCompass 、MotionBench 等关键测评中处于领先位置,且在 EgoTempo 基准上超过了人类分数,表明它对“变化、动作、节奏”这类信息的捕捉更为稳定,在工程侧可用性更高。

  长视频场景中,豆包大模型2.0在大部分评测上超越了其他顶尖模型,且在多个流式实时问答视频基准测试中表现优异,能作为 AI 助手完成实时视频流分析、环境感知、主动纠错与情感陪伴,实现从被动问答到主动指导的交互升级,可应用于健身、穿搭等陪伴场景。

  下面这个场景中,豆包大模型2.0基于空间理解和运动理解能力,能吃透台球走位、准确推理击打位置。

  运动场上,豆包大模型2.0则可以成为你的最佳运动教练,精细识别各类运动动作,给出最适配的策略和建议。比如,它能根据用户录制上传的滑雪视频,精细识别动作,给出专业指导。

  LLM与Agent表现大幅强化

  真实长程任务执行能力提升

  除了多模态理解能力,豆包大模型2.0还在推理、多轮指令遵循、搜索、工具调用、输出格式稳定性等方面进行了大幅增强。

  通过系统性加强长尾领域知识,豆包大模型2.0能更好地处理专业场景的任务。豆包大模型2.0 Pro 在 SuperGPQA 上分数超过 GPT 5.2,并在 HealthBench 上拿到第一名,其在科学领域的整体成绩与 Gemini 3 Pro 和 GPT 5.2相当。

  在推理和 Agent 能力评测中,豆包大模型2.0 Pro 在 HLE-text 上取得54.2的高分,领跑全球;在国际数学奥赛(IMO)测评集上超越Gemini 3 pro,展现了强劲的数学和推理能力;在工具调用 MCP-Mark 和指令遵循 Multi-Challenge 也有出色表现。

  此外,豆包大模型2.0 Pro 在跨学科知识应用上的能力显著增强,其在 FrontierSci 等 STEM 基准测试中表现突出,部分场景得分超过 Gemini 3 Pro。

  豆包大模型2.0还重点强化了指令遵循能力。评测显示,豆包大模型2.0可保持较强的一致性与可控性,作为 Agent 模型能够在长链路、多步骤任务中严格按约束条件执行。

  从基础 Agent 能力的得分来看,豆包大模型2.0 在长链路任务中表现突出,尤其擅长连续完成“找资料、做归纳、写结论”等连续工作流。深度研究任务中,豆包大模型2.0 Pro 在相关的三项评测上均取得最高分。

  举个例子,我们让豆包大模型2.0在扣子里撰写一篇科技春晚40年的文章。模型先规划任务,处理上传的春晚观播量数据,再调用工具搜索历年春晚技术,中间不断反思、自检、确认,最终出色完成搜索任务。接下来,模型会基于数据和素材撰写文章,中间遵循新指令,不断优化文章结构,增加必要的章节、小标题等。在确定文字内容后再调取技能生成封面图片,并按春节的喜庆风格进行排版,完美遵从了多轮的指令要求。

  在提升了长程任务执行能力的同时,豆包大模型2.0 还进一步降低了推理成本。其模型效果与业界顶尖大模型相当,但 Token 定价降低了约一个数量级。在现实世界的复杂任务中,由于大规模推理与长链路生成将消耗大量 Token,这一成本优势将变得更为关键。

  OpenClaw 是目前火爆的开源 Agent 项目,我们基于 OpenClaw 框架和豆包大模型2.0,在飞书上构建了一个智能客服 Agent。通过调用不同技能,客服 Agent 能出色地完成客户对话,当遇到解决不了的难题,还会主动拉群求助真人同事,帮客户预约上门维修人员,并在维修后主动进行回访,顺带推荐春节优惠产品。

  提升开发效率

  带来更好体验

  Doubao-Seed-2.0-Code 是一款面向真实编程环境优化的 Coding 模型,能稳定调用 Claude Code 等常见 IDE 中的工具。模型特别优化了前端能力,在使用常见的前端框架时能有良好表现;同时支持使用 Skills,可以配合多种自定义技能(例如生图等)使用,尤其是和 TRAE 配合使用,效果更好。

  通过豆包大模型2.0和 TRAE,仅使用几轮提示词,就能快速构建一个复杂的“AI 春节庙会”主题 Web 应用。

  在这个庙会里,每个 AI 小人都拥有环境感知、认知推理和记忆系统,能够自主产生连贯行为、社交互动,并推进拟真的生活与任务流程,是一个真实的庙会现场。

  这个场景中,通过结合豆包大模型2.0和 TRAE,只需要一轮提示词,就可以构建出基本的的架构和场景,再经过几次调试,总共5轮提示词,可以直接完成这个作品。相关提示词与素材已开源,供开发者朋友测试或二次创作,欢迎大家通过火山引擎官网体验:

  https://www.volcengine.com/product/trae

  此外,为了解决 Agent 时代 Tokens 使用量爆炸的难题,我们也在第一时间更新了 Coding Plan 套餐包。即刻起,开发者可以在火山方舟 Coding Plan 中调用 Doubao-Seed-2.0-Code,新用户首月最低8元即可畅享模型自由,为不同编程任务匹配最适合的模型。

  豆包大模型2.0系列的更新,是面向现实世界复杂任务的新起点。未来,火山引擎将继续携手千行百业的企业和个人用户,持续在 AI 领域创造与创新。

关注同花顺财经(ths518),获取更多机会

0

+1
  • 北信源
  • 兆易创新
  • 科森科技
  • 卓翼科技
  • 天融信
  • 吉视传媒
  • 御银股份
  • 中油资本
  • 代码|股票名称 最新 涨跌幅