IT之家4月29日消息,GitHub依旧是开发者领域的主流平台,围绕代码托管、团队协作与开源开发形成了庞大的生态体系。即便在被微软(MSFT)收购之后,GitHub仍保持自然增长态势,这一势头一直延续到去年。而2025年初,AI编程热潮开始进一步推高GitHub的使用量。此后,随着智能体在开发者群体中成为主流,GitHub的用户使用规模迎来了前所未有的爆发式增长。
IT之家注意到,GitHub于2025年10月启动了一项扩容计划,目标是将平台承载能力提升至原有10倍,以此应对激增的需求。然而到2026年2月,公司意识到,未来的业务规模或将达到当前的30倍,必须提前做好布局。这种空前的增长压力,已严重拖累了平台的稳定性。事实上,过去数月间,GitHub不仅发生过数次影响广大开发者的重大故障,还出现了多起小规模服务中断事件。
今日,GitHub团队发布官方博客,就平台现状作出说明。概括而言,团队目前正在重构部分底层基础设施,旨在提升平台的可用性、可扩展性与抗故障能力。人工智能(885728)赋能的软件开发(881272),使得代码仓库创建、合并请求活跃度、接口调用、自动化流程以及大型仓库负载等各项业务均迎来极速增长。以GitHub如今的体量来看,任何子系统中微小的效率短板,久而久之都会演变成严重的系统性问题。
对于复杂的网络服务而言,服务中断本是常见现象,但GitHub频发的故障已引发用户公开抱怨。知名项目Ghostly的开发者米切尔桥本今日也发布博客表示,由于近几个月平台频繁出现稳定性问题,他决定将Ghostly项目从GitHub迁移至其他平台。
为解决用户面临的各类问题,GitHub团队现已确立优先级排序:优先保障服务可用性,其次扩充承载容量,最后再迭代新功能。过去几个月里,团队已完成多项优化,化解了多处性能瓶颈。同时,GitHub将部分算力需求迁移至微软(MSFT)Azure云平台后,得以根据业务负载灵活弹性扩容。为进一步降低故障影响,GitHub正将Git、GitHub Actions等核心关键服务与其他业务负载进行物理隔离。官方还证实,正在推进多云架构建设,以全面提升平台的容灾抗风险能力。
GitHub还披露了近期两起故障事件的详细情况:
4 月23日,平台出现功能回退问题,导致合并队列功能异常,此次故障共计影响658个代码仓库、2092个合并请求。
4 月27日,平台Elasticsearch搜索引擎子系统突发独立故障,目前官方仍在开展根本原因分析。GitHub表示,本次事件未造成任何数据丢失,Git基础操作与开放接口服务均未受波及,但依赖搜索功能的部分页面无法展示检索结果,给用户使用造成了明显困扰。
GitHub在博客文末再次致歉,并承诺将持续致力于提升服务可用性、增强平台抗故障能力,同时优化故障发生期间及事后的官方沟通机制。
