云服务可靠性再敲警钟 Cloudflare披露5小时中断事故详情
14 小时前

当地时间2025年11月18日,全球互联网基础设施巨头Cloudflare发生大规模服务中断,导致全球多家主要网站无法访问。据网站故障追踪机构Downdetector(该平台自身也一度受影响)统计,受影响的平台包括Anthropic的Claude聊天机器人、特朗普的Truth Social、马斯克旗下社交媒体平台X,以及美国新泽西公交系统的部分数字服务。OpenAI的状态页面显示,ChatGPT及其Sora短视频应用因“第三方服务提供商”问题出现故障,后已完全恢复。Cloudflare自2009年组建于哈佛大学,2010年推出首批测试版,2019年在纽约证券交易所上市,目前服务30%的财富1000强公司,其流量管理及安全防护服务覆盖约20%的互联网流量。受此次事件影响,截至美股18日收盘,Cloudflare股价下跌2.83%。公司联合创始人兼CEO马修·普林斯表示,这是Cloudflare自2019年以来最严重的中断,并代表团队为给互联网造成的困扰道歉。CTO戴恩·克内切特在社交平台发文称,事故源于公司支撑僵尸程序缓解功能的某个服务存在潜在缺陷,在进行常规配置变更后崩溃,进而引发网络及其他服务的大范围退化,而非遭受攻击所致。当地时间11月19日一早,Cloudflare发布完整报告,详细描述了持续近5个小时的事件经过:18日上午11:28开始出现影响,客户HTTP流量首次观察到错误;14:30主要影响解决,下游受影响服务错误减少,大多数服务开始正确运行;17:06所有下游服务重启,操作完全恢复。Cloudflare表示,已着手研究如何加强系统以防未来发生类似故障,包括强化配置文件的摄入处理、为功能启用更多全局紧急停止开关等措施。