开云app登录入口

开云app Azure云做事中断超10小时影响诬捏机和身份做事

发布日期:2026-02-15 12:35    点击次数:80

开云app Azure云做事中断超10小时影响诬捏机和身份做事

微软的Azure云平台在周一晚间遇到了一次捏续多小时的大领域中断,影响了企业云运营的两个要津层面。这次中断捏续提高10小时,从周一19:46 UTC启动,直到周二06:05 UTC才得到贬责。

故障当先导致客户无法在多个区域部署或扩展诬捏机。随后,在周二00:10 UTC至06:05 UTC技术,好意思国东部和西部区域的Azure资源托管身份做事出现关连平台问题。这次中断还片刻影响了GitHub Actions。

证据微软情状历史纪录,一项计策转换不测期骗到了一部分微软握住的存储账户,包括用于托管诬捏机扩展包的存储账户,这导致了这次中断。该转换劳作了大师读取造访,中断了诬捏机扩展包下载等场景。

在跟踪ID FNJ8-VQZ下纪录的问题中,一些客户在部署或扩展诬捏机时遇到失败,包括成立和生命周期操作技术的诞妄。其他做事也受到影响。

Azure Kubernetes Service用户在节点成立和扩展装配方面遇到失败,而Azure DevOps和GitHub Actions用户在职务需要诬捏机扩展或关连包时濒临管谈失败。需要从微软握住的存储账户下载扩展包的操作也出现性能下落。

{jz:field.toptypename/}

固然初步缓解方法在简略两小时里面署,但它激发了第二个触及Azure资源托管身份的平台问题。试图创建、更新或删除Azure资源,或获得托管身份令牌的客户启动遇到认证失败。

微软情状历史页面在跟踪ID M5B-9RZ下说明,在早期缓解方法之后,无数流量激增使好意思国东部和西部区域的托管身份平台做事不胜重任。

这影响了具有分拨托管身份的Azure资源的创建和使用,包括Azure Synapse Analytics、Azure Databricks、Azure Stream Analytics、Azure Kubernetes Service、Microsoft Copilot Studio、Azure Chaos Studio、Azure Database for PostgreSQL天真做事器、Azure容器期骗、Azure防火墙和Azure AI视频索引器。

{jz:field.toptypename/}

在屡次基础方法扩容尝试无法处理积压和重试量后,微软最终将流量从受影响的做事中移除,以在无负载情况下设备底层基础方法。

EIIRTrend和Pareekh Consulting首席实施官Pareekh Jain示意:"这次中断不仅使网站下线,还中止了开发职责经由并干预了本色运营。"

连年来云做事中断变得愈加鄙俚,AWS、Google Cloud和IBM等主要供应商皆阅历了备受瞩指标中断。当DNS问题导致DynamoDB API不成靠时,AWS做事受到了提高15小时的严重影响。

11月,Cloudflare机器东谈摆布理系统中的诞妄成立文献导致多个在线平台出现间歇性做事中断。6月,无效的自动更新中断了该公司的身份和造访握住系统,导致用户无法使用Google在第三方期骗上进行身份考证。

Counterpoint Research聚拢首创东谈主兼副总裁Neil Shah示意:"络续发展的数据中心架构受到AI新速率和可变性驱动的更具挑战性复杂职责负载调遣的影响。这种快速延迟不仅带来了复杂性,还挑战了现存的依赖关系。因此,戒指层的任何诞妄成立或握住欠妥皆可能中断环境。"

这不是一个孤单事件。关于CIO来说,这一事件仅仅加强了再行念念考弹性计策的必要性。

Jain指出,开云app登录入口在超大领域依赖失败的径直末端中,恭候对CIO来说不是保举计策,他们应该专注于踏实、优先级和调换计策。"最先,通过秘书负责的云事件并指定单一事件带领官来踏实场面,快速细目问题是否影响戒指平面操作或运行职责负载,并冻结悉数非必要转换,如部署和基础方法更新。"

Jain补充说,下一步是通过保护面向客户的运行旅途来优先收复,包括流量做事、支付、身份考证和维持,若是CI/CD受到影响,将要津管谈转换到自托管或替代运行器,同期将发布列队在业务批准的门控背面。临了,通过发布明确讲解受影响做事、可用贬责决策和下次更新时刻的如期里面更新来调换和戒指,若是可能产生外部影响,则启动事前批准的客户调换模板。

Shah指出,这些中断对企业和CIO来说是一个明确的劝诫,要在云做事提供商之间多元化职责负载或经受搀杂口头并添加必要的冗余。为退缩将来中断影响运营,他们还应该握住CI/CD管谈的领域,保捏其精简和模块化。

甚而及时与非及时扩展计策,相等是对要津代码或做事,皆应该三念念此后行。CIO还应该澄澈了解和操作可见性荫庇的依赖关系,知谈在这种情况下什么可能受到影响,并制定强有劲的缓解贪图。

Q&A

Q1:Azure这次中断的主要原因是什么?

A:Azure中断的主要原因是一项计策转换不测期骗到了微软握住的存储账户,包括用于托管诬捏机扩展包的存储账户。该转换劳作了大师读取造访,中断了诬捏机扩展包下载等场景,随后的缓解方法又激发了托管身份做事的问题。

Q2:哪些Azure做事受到了影响?

A:受影响的做事包括诬捏机部署和扩展、Azure Kubernetes Service、Azure DevOps、GitHub Actions、Azure Synapse Analytics、Azure Databricks、Azure Stream Analytics、Microsoft Copilot Studio、Azure Chaos Studio、Azure容器期骗、Azure防火墙和Azure AI视频索引器等多项做事。

Q3:CIO应该如何应付云做事中断?

A:CIO应该经受踏实、优先级和调换的计策。最先通过指定事件带领官踏实场面,快速细目问题领域并冻结非必要转换;然后优先保护面向客户的要津做事;临了进行如期调换更新。同期还应该在多个云做事提供商间分布职责负载,保捏CI/CD管谈精简模块化。



 




Powered by 开云app登录入口 @2013-2022 RSS地图 HTML地图