大模型打响价值战 AI技术迭代与商业模式创新引领新一轮降价潮
随着技术升级,AI大模型应用价格下探,Agent有望进一步普及。6月11日,火山引擎发布豆包大模型1.6、豆包视频生成模型Seedance 1.0 Pro、豆包语音播客模型等新模型,并上线AI云原生系列产品。
最新豆包大模型拥有思考、规划、多模态理解和行动能力,能够端到端处理复杂任务,是构建Agent(智能体)的基础;AI云原生则提供性能和功能强大、使用简单、生态兼容的产品和方案集合,支持Agent开发范式。两类产品能够帮助企业更快、更省地构建生产级Agent。
技术升级之外,新一轮大模型降价潮将加速Agent规模化,也为实现AI普惠注入强心剂。
技术“飞轮”破解Agent落地难题
随着技术演进,互联网产品形态历经了多次重大变革。技术主体从PC时代的Web,到移动时代的APP,再到如今AI时代的Agent,开发范式与技术架构已发生翻天覆地的变化,同时也改变了人机交互方式。
与传统软件相比,火山引擎总裁谭待认为,Agent能够自主感知、规划和反思,完成复杂任务,从被动的工具变成主动的执行者。
技术日新月异,AI Agent展现出广阔的市场前景,但距离其全面落地尚有一段距离。InfoQ研究中心在半年前发布的《2024中国AI Agent应用研究报告》中指出,AI Agent尚处于早期推广技术阶段,在自主思考、规划与工具调用、记忆和多模态理解等方面仍存在不足,难以应对复杂场景。
为抢夺新高地,国内外头部互联网厂商着力攻坚大模型迭代。大模型发展已历经感知AI、生成式AI阶段,正式迈入Agentic AI时代。
“我们希望大模型不再仅仅完成信息的识别、处理和生成,而是能够自主推理、规划行动并执行任务,从而成为构建复杂业务闭环的智能体。”谭待在火山引擎Force原动力大会上表示,深度思考、多模态理解和工具自主调用是模型进化的关键要素。
为此,火山引擎正式发布豆包大模型1.6系列——doubao-seed-1.6、doubao-seed-1.6-thinking和doubao-seed-1.6-flash,进一步优化模型能力和服务成本。
其中,doubao-seed-1.6是all-in-one的综合模型,拥有深度思考,多模态理解,图形界面操作等多项能力。同时,doubao-seed-1.6也是国内首个支持256K上下文的思考模型,支持thinking(深度思考)、non-thinking(非深度思考)和自适应三种模式,能够端到端处理复杂任务。
doubao-seed-1.6-thinking则强化深度推理,编码、数学、逻辑能力显著提升,支持复杂 Agent 构建。极速版本doubao-seed-1.6-flash延迟低至 10ms,适用于实时交互场景(如智能客服、语音助手)。
优化后的豆包大模型实力如何?其在GPQA Diamond测评集上取得了81.5分;在数学测评AIME25获得了86.3分;MultiChallenge上得分48分。在众多权威测评集上,豆包大模型的得分均属于国际第一梯队。
豆包最新模型的推理能力显著提升。有媒体针对高考全国新一卷数学单科测评显示,豆包的成绩是144分,位列全国第一。在高考前的海淀区模拟全卷进行测评中,豆包1.6分别录得理科706分,文科712分,对比去年的测评分数分别提升154分和90分。
由于豆包大模型强化多模态理解和图形界面操作能力,从而具备自主思考和规划能力,能够完成更复杂的任务。大模型已经可以支持实时视频通话分析、商品图片同款识别、自动驾驶数据标注等。拥有GUI操作与编程能力的大模型,直接操控软件界面(如自动预订酒店、整理旅行票据),前端开发效率提升10倍,可一键生成企业级CRM系统原型。
截至目前,豆包大模型已在宝马、奔驰、招商银行、浦发银行得以应用,服务全球TOP10手机厂商中的9家、八成主流汽车品牌、70%系统重要性银行及超五成985高校。以AI汽车营销创新服务为例,今年4月,宝马与火山引擎联合以AI+场景高效匹配产品与购车建议、精确内容引导,全面提升用户购车体验与经销商运营效能。据统计,双方合作推出的AI智能营销工具已经支持了全国约300家BMW经销商。
伴随落地场景多元化,以及用户规模扩大,豆包大模型日均Tokens调用量从2024年12月的4万亿飙升至2025年5月的16.4万亿,年增长率超 300%,以46.4%的市占率稳居中国公有云大模型服务调用量榜首。
为了更好地支持Agent开发与应用,火山引擎AI云原生全栈服务升级,发布了火山引擎MCP服务、PromptPilot智能提示工具、AI知识管理系统、veRL强化学习框架等产品,并推出多模态数据湖、AICC私密计算、大模型应用防火墙,以及一系列AI Infra套件。
新一轮降价剑指AI普惠
AI Agent规模化落地还面临成本挑战。中信建投(601066)证券从Manus定价及表现推断,Agent对话交互Token消耗或达 十万以上,远超chatbot类AI产品,大幅增加Agent落地成本。业内期待模型使用成本下降。
火山引擎通过深度技术优化,为豆包大模型1.6创新推出“区间定价”,模式,精准匹配企业需求分布,实现成本与性能的双重突破。
目前市场上大模型定价规则主要依据模型能力。但在实际应用中,对于同结构同参数的模型而言,对成本真正影响的是上下文长度,而不是是否开启了思考和多模态功能。另外,上下文长度对成本的影响是累加的,上下文越长,或者输入越长,每一个输出的成本就会递增。火山引擎洞察到,模型输入输出长度的分布呈现一定规律,当前大部分调用的输入范围都在32K以内。
基于上述观察,谭待认为,如果火山引擎在推理调度上,能够做好按照上下文长度进行分桶调度,就能够将80%的请求导向0-32K区间,利用短文本处理的高并行性提升效率,降低单位成本。
通过技术创新,豆包大模型1.6首创按“输入长度”区间定价模式,深度思考、多模态能力与基础语言模型统一价格。
在企业使用量最大的0-32K输入区间,豆包1.6的输入价格为0.8元/百万tokens、输出8元/百万tokens,综合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。Seedance 1.0 pro模型每千 tokens仅0.015元,每生成一条5秒的1080P视频只需3.67元,为行业最低。
此外大模型支持“All in one”,并且用户无需额外付费即可调用图文、音视频等多模态能力。“不管是从成本还是便利性上都是很大的提升。”谭待表示。
从短期来看,大模型降价能够加速Agent规模化,直接推动多模态深度思考功能在客服、数据分析等场景的普及。
对行业而言更具长远意义的是,火山引擎通过技术和商业模式创新,降低企业AI应用门槛,引领AI云原生的市场发展,在AI普惠征程中又向前一步。
0人