大厂集体收紧Token额度背后:警惕AI失控成为企业成本“黑洞”中性

2026-07-03 18:36:49
分享
AIME

问财摘要

1、近期,科技行业接连传出消息,微软已收回内部对AI编程工具Claude Code的许可,Uber在短短4个月内便耗尽了全年的AI工具预算,亚马逊和Meta等巨头也纷纷采取措施,限制员工无意义的Token消耗。这些现象折射出一个普遍存在的难题:在人人拥抱AI的热潮下,企业正面临着一个日益凸显的成本“黑洞”——Token消耗失控。 2、奇安信人工智能公司推出的AI安全网关,定位为位于企业应用与AI服务之间的中间层基础设施,作为企业AI流量的统一控制平面,为所有AI调用提供集中的算力管理、纳管治理、安全防护与可观测能力。
免责声明 内容由AI生成
文章提及标的
微软--
亚马逊--
Meta--
百度--
奇安信-U--
人工智能--

近期,科技行业接连传出消息,微软(MSFT)已收回内部对AI编程工具Claude Code的许可,Uber在短短4个月内便耗尽了全年的AI工具预算,亚马逊(AMZN)Meta(META)等巨头也纷纷采取措施,限制员工无意义的Token消耗。这些现象折射出一个普遍存在的难题:在人人拥抱AI的热潮下,企业正面临着一个日益凸显的成本“黑洞”——Token消耗失控。

当AI应用从个人尝鲜走向企业级普及时,算力与成本的失控,正成为阻碍其深入发展的头号烦恼。员工与智能体(Agent)通过个人账号、自购API Key等方式直连各家大模型,导致算力自己买、用量没人看、权限没人管。这种分散、无序的调用方式,让企业AI投入变成了一笔笔难以追溯的“糊涂账”。

算力与成本失控,大厂、中小厂商都“烦恼”

AI很贵,而且越来越贵,甚至超出了大厂的承受能力。

2026年5月,微软(MSFT)决定取消大部分员工对Claude Code的内部许可。这款由Anthropic推出的AI编程工具,在微软(MSFT)内部开放仅6个月就成为最受欢迎的辅助开发软件之一,随之而来的是Token消耗剧增、成本暴涨。部分工程师个人每月的Token花费就在500到2000美元之间。微软(MSFT)踩下刹车,将员工导回自家的Copilot CLI。

Uber的遭遇更为惨烈。这家网约车巨头原本规划覆盖全年的AI预算,仅4个月便消耗殆尽,单个工程师月均AI开销达到500至2000美元。为遏制成本失控,Uber紧急划定了单人每月1500美元的Token使用上限。

Meta(META)内部测算显示,若维持当前员工调用增速,2026年仅内部AI使用一项支出便将达数十亿美元。今年3月,为了营造自己是一家“AI-Native”公司的人设,Meta(META)曾在内部上线“Claudeonomics”榜单——员工消耗的Token越多,排名越高;垫底员工甚至面临被裁风险。结果可想而知:员工开始疯狂刷Token,畸形竞争下消耗的成本远超预期,榜单很快被撤下。

国内大厂也高度重视此类问题。此前有媒体报道,腾讯从2026年6月起调整内部AI Token额度,从此前较为固定的配额机制,改为按部门、岗位和任务场景进行差异化、动态式分配。字节跳动允许AI研发岗审批外采API;百度(BIDU)则依部门差异化配置。

中小厂商同样承压。广州某跨境支付企业将人均月额度从不限量压至500美元,此前单月消耗40万美元;员工间出现借Token现象,后端开发者两日即耗尽370美元;有程序员为用完额度续写《红楼梦》。上海某老牌互联网公司启用钉钉审批制,人均额度数百至千元不等;北京某腰部公司开放Anthropic API接口,每人每月1000元,并强制优先使用国产低价模型。

不能因噎废食,加强AI管控迫在眉睫

当然,如果因为担忧AI太贵,就放弃拥抱先进生产力,无异于因噎废食,绝不可取。奇安信(688561)认为,这一系列事件的本质,是企业AI应用正在快速普及,但管理却严重滞后。

“员工与Agent正以个人账号、自购Key等方式直连各家大模型——算力自己买、用量没人看、权限没人管。”奇安信(688561)人工智能(885728)公司X实验室首席架构师柯强如此描述当前乱象。

具体而言,表现在三个层面:

首先是用量与花费成“黑盒”。员工各自购买Tokens,各自走报销流程,导致企业整体用量与花费完全不透明。超支问题往往在月底或季度末的账单上才被发现,为时已晚。

其次是缺乏预算与配额管控。企业缺少按部门、按项目或按人员进行预算与配额管控的有效手段。研发、运营、客服等不同部门对AI的需求和成本敏感度各不相同,但“一刀切”或“无管理”的模式,使得资源无法被高效分配。

最后是模型选择与成本不匹配。简单任务调用昂贵的旗舰模型,造成不必要的浪费。例如,一个简单的文本摘要任务,本可由轻量级模型高效完成,却可能被错误地发送给价格高昂的顶级模型处理。

这种成本失控的局面,让企业在推进AI应用时陷入两难:不放开使用,会抑制创新效率;放开使用,又面临成本无限膨胀的风险。如果管理不善,这笔不断增长的AI开支甚至可能给企业经营带来潜在的财务隐患。

奇安信AI安全网关,让成本消耗可视、可管、可控

成本失控的根源在于“看不见、管不住”。因此,解决问题的第一步,是让一切可见。

奇安信(688561)人工智能(885728)公司推出的AI安全网关,定位为位于企业应用与AI服务之间的中间层基础设施,作为企业AI流量的统一控制平面,为所有AI调用提供集中的算力管理、纳管治理、安全防护与可观测能力。

在成本可观测性方面,AI安全网关提供全链路的请求日志与追踪能力。管理层可以通过Dashboard实时查看每个部门、每个员工、每个Agent的Tokens用量和花费,实现精细化的成本分析。每次请求的输入、输出、使用的模型及检测结果都将被完整留存,支持多维检索。所有AI交互行为“干了什么,一查便知”,满足合规审计要求。

看得见只是第一步,管得住才是关键。

AI安全网关支持企业按部门、人员或虚拟密钥(vKey),三级独立配置Tokens配额、金额上限和可用模型范围。例如,可规定涉密部门只能使用私有化部署的模型,而研发部门则可按需使用顶级模型。同时,网关的语义缓存功能能够识别并直接响应相似请求,减少重复调用上游模型,持续压降模型调用成本。

此外,网关的智能路由能力支持按人员、部门、预算等条件,将AI请求自动分流到最合适的模型与通道。当上游模型出现故障或超时时,网关能自动切换至备用通道,实现故障无感知的切换。在部门预算即将用尽时,系统可自动将请求降级到低成本模型,在保障业务连续性的同时,有效控制成本上限。

统一接入则让企业可统一采购和管理所有AI算力资源,员工无需再自购Tokens或管理复杂的API Key。通过网关签发的虚拟密钥,员工即可无缝切换使用多家提供商的模型,且无需改造现有业务代码。密钥集中托管与一键轮换,杜绝了密钥泄露风险。

从“算力自己买、用量没人看、权限没人管”到“公司统一买单、用量实时可见、权限精细管控”——奇安信(688561)AI安全网关让每一次AI调用真正做到了可管、可控、可审计。

值得一提的是,奇安信(688561)AI安全网关的第一个“用户”,正是奇安信(688561)自己。目前,该产品已率先在奇安信(688561)内部落地应用,统一为各部门、员工和业务系统分配Tokens配额与可用模型资源,并依据业务场景和请求内容进行智能路由与动态调度。产品上线运行后,通过合理tokens规划与管理,以及语义缓存复用与低成本模型分流,在保障各业务线加速AI深度应用的同时,内部AI调用成本明显下降,实现了提升效率和控制成本的两者兼顾。

独立交付,三步接入,零业务代码改动

好的产品,不仅要“好用”,还要“好装”。

奇安信(688561)AI安全网关以独立产品形态交付,不绑GPU、不绑模型、不绑云基座。已部署的一体机、私有化模型无需替换,本地模型直接注册为Provider即可纳管,跨厂商统一身份、安全、审计与治理能力。

对于已有护栏的客户,产品可与现有系统共存或整合,能力互补——护栏解决内容安全一项,网关解决身份、审计、治理、安全、可观测五大能力。

接入过程极为简便,无需改动业务代码,仅需三步即可在分钟级内完成现有AI调用的统一管控:第一步,将工具或SDK的Base URL指向网关统一地址;第二步,将原本散落的真实API Key替换为网关签发的虚拟密钥vKey;第三步,所有调用自动纳入统一管控——身份、安全、治理、可观测能力自动生效。

结束语

Gartner预测,到2028年,超过80%的中国企业将出现员工对生成式人工智能(885728)进行无管理使用的情况。IBM《2025数据泄露成本报告》也警示,企业应用AI的速度远超过其建设AI安全与治理的速度。可见,如果放任不管,Token成本失控将从“小问题”演变为“大隐患”——不仅吞噬利润,更可能让企业在AI时代的竞争中,从“先发优势”变成“先发劣势”。从微软(MSFT)到Uber,从Meta(META)到腾讯,全球科技巨头用真金白银买来的教训值得每一个企业警醒。

AI本身不是问题,问题在于缺乏管控。奇安信(688561)AI安全网关的出现,为企业提供了一套“看得见、管得住、装得上”的完整方案——让每一次AI调用都可管、可控、可审计,让Token从“成本黑洞”变成“生产力引擎”。

免责声明:风险提示:本文内容仅供参考,不代表同花顺观点。同花顺各类信息服务基于人工智能算法,如有出入请以证监会指定上市公司信息披露平台为准。如有投资者据此操作,风险自担,同花顺对此不承担任何责任。
homeBack返回首页
不良信息举报与个人信息保护咨询专线:10100571违法和不良信息涉企侵权举报涉算法推荐举报专区涉青少年不良信息举报专区

浙江同花顺互联信息技术有限公司版权所有

网站备案号:浙ICP备18032105号
证券投资咨询服务提供:浙江同花顺云软件有限公司 (中国证监会核发证书编号:ZX0050)
AIME