大厂集体收紧Token额度背后：警惕AI失控成为企业成本“黑洞”

近期，科技行业接连传出消息，微软（MSFT）已收回内部对AI编程工具Claude Code的许可，Uber在短短4个月内便耗尽了全年的AI工具预算，亚马逊（AMZN）和Meta（META）等巨头也纷纷采取措施，限制员工无意义的Token消耗。这些现象折射出一个普遍存在的难题：在人人拥抱AI的热潮下，企业正面临着一个日益凸显的成本“黑洞”——Token消耗失控。

当AI应用从个人尝鲜走向企业级普及时，算力与成本的失控，正成为阻碍其深入发展的头号烦恼。员工与智能体（Agent）通过个人账号、自购API Key等方式直连各家大模型，导致算力自己买、用量没人看、权限没人管。这种分散、无序的调用方式，让企业AI投入变成了一笔笔难以追溯的“糊涂账”。

算力与成本失控，大厂、中小厂商都“烦恼”

AI很贵，而且越来越贵，甚至超出了大厂的承受能力。

2026年5月，微软（MSFT）决定取消大部分员工对Claude Code的内部许可。这款由Anthropic推出的AI编程工具，在微软（MSFT）内部开放仅6个月就成为最受欢迎的辅助开发软件之一，随之而来的是Token消耗剧增、成本暴涨。部分工程师个人每月的Token花费就在500到2000美元之间。微软（MSFT）踩下刹车，将员工导回自家的Copilot CLI。

Uber的遭遇更为惨烈。这家网约车巨头原本规划覆盖全年的AI预算，仅4个月便消耗殆尽，单个工程师月均AI开销达到500至2000美元。为遏制成本失控，Uber紧急划定了单人每月1500美元的Token使用上限。

Meta（META）内部测算显示，若维持当前员工调用增速，2026年仅内部AI使用一项支出便将达数十亿美元。今年3月，为了营造自己是一家“AI-Native”公司的人设，Meta（META）曾在内部上线“Claudeonomics”榜单——员工消耗的Token越多，排名越高；垫底员工甚至面临被裁风险。结果可想而知：员工开始疯狂刷Token，畸形竞争下消耗的成本远超预期，榜单很快被撤下。

国内大厂也高度重视此类问题。此前有媒体报道，腾讯从2026年6月起调整内部AI Token额度，从此前较为固定的配额机制，改为按部门、岗位和任务场景进行差异化、动态式分配。字节跳动允许AI研发岗审批外采API；百度（BIDU）则依部门差异化配置。

中小厂商同样承压。广州某跨境支付企业将人均月额度从不限量压至500美元，此前单月消耗40万美元；员工间出现借Token现象，后端开发者两日即耗尽370美元；有程序员为用完额度续写《红楼梦》。上海某老牌互联网公司启用钉钉审批制，人均额度数百至千元不等；北京某腰部公司开放Anthropic API接口，每人每月1000元，并强制优先使用国产低价模型。

不能因噎废食，加强AI管控迫在眉睫

当然，如果因为担忧AI太贵，就放弃拥抱先进生产力，无异于因噎废食，绝不可取。奇安信（688561）认为，这一系列事件的本质，是企业AI应用正在快速普及，但管理却严重滞后。

“员工与Agent正以个人账号、自购Key等方式直连各家大模型——算力自己买、用量没人看、权限没人管。”奇安信（688561）人工智能（885728）公司X实验室首席架构师柯强如此描述当前乱象。

具体而言，表现在三个层面：

首先是用量与花费成“黑盒”。员工各自购买Tokens，各自走报销流程，导致企业整体用量与花费完全不透明。超支问题往往在月底或季度末的账单上才被发现，为时已晚。

其次是缺乏预算与配额管控。企业缺少按部门、按项目或按人员进行预算与配额管控的有效手段。研发、运营、客服等不同部门对AI的需求和成本敏感度各不相同，但“一刀切”或“无管理”的模式，使得资源无法被高效分配。

最后是模型选择与成本不匹配。简单任务调用昂贵的旗舰模型，造成不必要的浪费。例如，一个简单的文本摘要任务，本可由轻量级模型高效完成，却可能被错误地发送给价格高昂的顶级模型处理。

这种成本失控的局面，让企业在推进AI应用时陷入两难：不放开使用，会抑制创新效率；放开使用，又面临成本无限膨胀的风险。如果管理不善，这笔不断增长的AI开支甚至可能给企业经营带来潜在的财务隐患。

奇安信AI安全网关，让成本消耗可视、可管、可控

成本失控的根源在于“看不见、管不住”。因此，解决问题的第一步，是让一切可见。

奇安信（688561）人工智能（885728）公司推出的AI安全网关，定位为位于企业应用与AI服务之间的中间层基础设施，作为企业AI流量的统一控制平面，为所有AI调用提供集中的算力管理、纳管治理、安全防护与可观测能力。

在成本可观测性方面，AI安全网关提供全链路的请求日志与追踪能力。管理层可以通过Dashboard实时查看每个部门、每个员工、每个Agent的Tokens用量和花费，实现精细化的成本分析。每次请求的输入、输出、使用的模型及检测结果都将被完整留存，支持多维检索。所有AI交互行为“干了什么，一查便知”，满足合规审计要求。

看得见只是第一步，管得住才是关键。

AI安全网关支持企业按部门、人员或虚拟密钥（vKey），三级独立配置Tokens配额、金额上限和可用模型范围。例如，可规定涉密部门只能使用私有化部署的模型，而研发部门则可按需使用顶级模型。同时，网关的语义缓存功能能够识别并直接响应相似请求，减少重复调用上游模型，持续压降模型调用成本。

此外，网关的智能路由能力支持按人员、部门、预算等条件，将AI请求自动分流到最合适的模型与通道。当上游模型出现故障或超时时，网关能自动切换至备用通道，实现故障无感知的切换。在部门预算即将用尽时，系统可自动将请求降级到低成本模型，在保障业务连续性的同时，有效控制成本上限。

统一接入则让企业可统一采购和管理所有AI算力资源，员工无需再自购Tokens或管理复杂的API Key。通过网关签发的虚拟密钥，员工即可无缝切换使用多家提供商的模型，且无需改造现有业务代码。密钥集中托管与一键轮换，杜绝了密钥泄露风险。

从“算力自己买、用量没人看、权限没人管”到“公司统一买单、用量实时可见、权限精细管控”——奇安信（688561）AI安全网关让每一次AI调用真正做到了可管、可控、可审计。

值得一提的是，奇安信（688561）AI安全网关的第一个“用户”，正是奇安信（688561）自己。目前，该产品已率先在奇安信（688561）内部落地应用，统一为各部门、员工和业务系统分配Tokens配额与可用模型资源，并依据业务场景和请求内容进行智能路由与动态调度。产品上线运行后，通过合理tokens规划与管理，以及语义缓存复用与低成本模型分流，在保障各业务线加速AI深度应用的同时，内部AI调用成本明显下降，实现了提升效率和控制成本的两者兼顾。

独立交付，三步接入，零业务代码改动

好的产品，不仅要“好用”，还要“好装”。

奇安信（688561）AI安全网关以独立产品形态交付，不绑GPU、不绑模型、不绑云基座。已部署的一体机、私有化模型无需替换，本地模型直接注册为Provider即可纳管，跨厂商统一身份、安全、审计与治理能力。

对于已有护栏的客户，产品可与现有系统共存或整合，能力互补——护栏解决内容安全一项，网关解决身份、审计、治理、安全、可观测五大能力。

接入过程极为简便，无需改动业务代码，仅需三步即可在分钟级内完成现有AI调用的统一管控：第一步，将工具或SDK的Base URL指向网关统一地址；第二步，将原本散落的真实API Key替换为网关签发的虚拟密钥vKey；第三步，所有调用自动纳入统一管控——身份、安全、治理、可观测能力自动生效。

结束语

Gartner预测，到2028年，超过80%的中国企业将出现员工对生成式人工智能（885728）进行无管理使用的情况。IBM《2025数据泄露成本报告》也警示，企业应用AI的速度远超过其建设AI安全与治理的速度。可见，如果放任不管，Token成本失控将从“小问题”演变为“大隐患”——不仅吞噬利润，更可能让企业在AI时代的竞争中，从“先发优势”变成“先发劣势”。从微软（MSFT）到Uber，从Meta（META）到腾讯，全球科技巨头用真金白银买来的教训值得每一个企业警醒。

AI本身不是问题，问题在于缺乏管控。奇安信（688561）AI安全网关的出现，为企业提供了一套“看得见、管得住、装得上”的完整方案——让每一次AI调用都可管、可控、可审计，让Token从“成本黑洞”变成“生产力引擎”。

大厂集体收紧Token额度背后：警惕AI失控成为企业成本“黑洞”中性