久久在线视频在线_欧美在线一级va免费观看_欧美日韩国产在线一区_亚洲一区二区三区在线观看视频

您當前的位置: 首頁 > 新聞 > 其他

15.5小時!阿里云史上最長大規模中斷:官方公告四大問題

來源:快科技 編輯:非小米 時間:2022-12-25 17:42人閱讀

12月18日,阿里云在我國香港出現大規模中斷,導致諸多依賴阿里云運行的應用和服務無法使用,造成廣泛影響。

12月15日,阿里云官方發布說明,詳細解釋了此次中斷故障的過程、原因,以及改進措施。

據悉,阿里云此次服務中斷源于水冷系統出現故障,且長時間無法恢復正常,導致機房溫度升高,現場處置不及時又導致觸發消防噴淋,部分硬件遇水損壞,另外客戶在香港地域新購ECS等管控操作失敗,長時間無法擴容。

從當天早上8點56分首次檢測到故障警告,次日凌晨0點30分所有服務恢復正常,歷時超過15個半小時。

阿里云承認,此次香港Region可用區C服務中斷事件,對很多客戶的業務產生重大影響,也是阿里云運營十多年來持續時間最長的一次大規模故障。

15.5小時!阿里云史上最長大規模中斷:官方公告四大問題

按照阿里云的官方還原,此次故障發生及處理過程如下——

08:56,監控到香港Region可用區C機房包間通道溫控告警,工程師介入應急處理。

09:01,阿里云監控到該機房多個包間溫升告警,此時工程師排查到冷機異常。

09:09,機房服務商按應急預案對異常冷機進行4+4主備切換以及重啟,但操作失敗,冷水機組無法恢復正常。

09:17,依照故障處理流程,啟動制冷異常應急預案,進行輔助散熱和應急通風。

嘗試對冷機控制系統逐個進行隔離和手工恢復操作,但發現無法穩定運行,聯系冷機設備供應商到現場排查。

此時,由于高溫原因,部分服務器開始受到影響。

10:30開始,為避免可能出現的高溫消防問題,阿里云工程師陸續對整個機房計算、存儲、網絡、數據庫、大數據集群進行降載處理。

期間,繼續多次對冷機設備進行操作,但均不能保持穩定運行。

12:30,冷機設備供應商到場,在多方工程師診斷下,對冷塔、冷卻水管路及冷機冷凝器進行手工補水排氣操作,但系統仍然無法保持穩定運行。

阿里云工程師對部分高溫包間啟動服務器關機操作。

14:47,冷機設備供應商對設備問題排查遇到困難,其中一個包間因高溫觸發了強制消防噴淋。

15:20,經冷機設備商工程師現場手工調整配置,冷機群控解鎖完成并獨立運行,第1臺冷機恢復正常,溫度開始下降。

工程師隨后繼續通過相同方法對其他冷機進行操作。

18:55,4臺冷機恢復到正常制冷量。

19:02,分批啟動服務器,并持續觀察溫升情況。

19:47,機房溫度趨于穩定。同時,阿里云工程師開始進行服務啟動恢復,并進行必要的數據完整性檢查。

21:36,大部分機房包間服務器陸續啟動并完成檢查,機房溫度穩定。

其中一個包間因消防噴淋啟動,未進行服務器上電。

為保持數據的完整性,工程師對這個包間的服務器進行了仔細的數據安全檢查,這里花費了一些必要的時間。

22:50,數據檢查以及風險評估完成,最后一個包間依據安全性逐步進行供電恢復和服務器啟動。

服務影響如下——

09:23,香港Region可用區C部分ECS服務器開始出現停機,觸發同可用區內宕機遷移。

隨著溫度繼續升高,受影響的服務器停機數量持續增加,客戶業務開始受到影響,影響面擴大到香港可用區C的EBS、OSS、RDS等更多云服務。

阿里云香港可用區C的故障,沒有直接影響客戶在香港其他可用區運行的業務,但影響了香港Region ECS管控服務(Control Plane)的正常使用。

因為大量可用區C的客戶在香港其他可用區新購ECS實例,14:49開始,ECS管控服務觸發限流,可用性最低跌至20%。

客戶在使用RunInstances/CreateInstance API購買新ECS實例時,如果指定了自定義鏡像,部分實例在購買成功之后會出現啟動失敗的現象,由于自定義鏡像數據服務依賴可用區C的單AZ冗余版本的OSS服務,無法通過重試解決。

此時,部分Dataworks、k8s用戶控制臺操作也受到了故障影響。API完全恢復可用為當日23:11。

10:37,阿里云香港可用區C的部分存儲服務OSS開始受到停機影響,此時客戶暫不會感知,但持續高溫會導致磁盤壞道,影響數據安全,工程師對服務器進行停機操作,11:07起中斷了服務,直到18:26。

阿里云在香港Region可用區C提供了2種類型的OSS服務,一種是OSS本地冗余LRS服務(通常叫單AZ冗余服務),僅部署在可用區C;另一種是OSS同城冗余ZRS服務(通常叫3AZ冗余服務),部署在可用區B、C和D。

在此次故障中,OSS同城冗余ZRS服務基本沒有受到影響。

可用區C的OSS本地冗余服務中斷時間較長,因不支持跨可用區切換,需要依賴故障機房的恢復。

18:26開始,存儲服務器重新分批啟動。

其中,單AZ本地冗余LRS服務有部分服務器因消防問題需要做隔離處理。恢復服務前,我們必須要確保數據可靠性,花費了較多的時間進行完整性檢驗工作。

直至12月19日00:30,這部分OSS服務(單AZ冗余服務)才恢復了對外服務能力。

阿里云網絡少量單可用區產品(如VPN、Privatelink以及少量GA實例)在此次故障中受到影響。

11:21,工程師啟動網絡產品可用區容災逃逸,12:45完成SLB等大部分網絡產品可用區容災逃逸,13:47,NAT產品完成收尾逃逸。

除上述少量單可用區產品以外,各網絡產品在故障期間保持了業務連續性,NAT有分鐘級業務受損。

10:17開始,阿里云香港Region可用區C部分RDS實例出現不可用的報警。

隨著該可用區受故障影響的主機范圍擴大,出現服務異常的實例數量隨之增加,工程師啟動數據庫應急切換預案流程。

截至12:30,RDS MySQL與Redis、MongoDB、DTS等跨可用區實例完成跨可用區切換。

部分單可用區實例以及單可用區高可用實例,由于依賴單可用區的數據備份,僅少量實例實現有效遷移。

少量支持跨可用區切換的RDS實例沒有及時完成切換。

經排查,是由于這部分RDS實例依賴了部署在香港Region可用區C的代理服務,而由于代理服務不可用,無法通過代理地址訪問RDS實例。阿里云協助相關客戶通過臨時切換到使用RDS主實例的地址訪問來進行恢復。

隨著機房制冷設備恢復,21:30左右絕大部分數據庫實例恢復正常。

對于受故障影響的單機版實例及主備均在香港Region可用區C的高可用版實例,阿里云提供了克隆實例、實例遷移等臨時性恢復方案,但由于底層服務資源的限制,部分實例的遷移恢復過程遇到一些異常情況,花費較長的時間來處理解決。

同時在多個可用區運行業務的客戶,在這次事件中依然可以維持業務運行。對于業務需要絕對高可用的客戶,阿里云建議采用全鏈路多可用區的業務架構設計,以應對各種可能的意外事件。

問題分析與改進措施——

1、冷機系統故障恢復時間過長

原因分析:

機房冷卻系統缺水進氣形成氣阻,影響水路循環導致4臺主冷機服務異常,啟動4臺備冷機時因主備共用的水路循環系統氣阻導致啟動失敗。

水盤補水后,因機房冷卻系統的群控邏輯,無法單臺獨立啟動冷機,手工修改冷機配置,將冷機從群控調整為獨立運行后,陸續啟動冷機,影響了冷卻系統的恢復時長。

整個過程中,原因定位耗時3小時34分鐘,補水排氣耗時2小時57分鐘,解鎖群控邏輯啟動4臺冷機耗時3小時32分鐘。

改進措施:

全面檢查機房基礎設施管控系統,在監控數據采集層面,擴大覆蓋度,提升精細度,提高對故障的排查和定位速度;在設施管控邏輯層面,確保系統自動切換邏輯符合預期,同時保證手工切換的準確性,防止內部狀態死鎖從而影響故障的恢復。

2、現場處置不及時導致觸發消防噴淋

原因分析:

隨著機房冷卻系統失效,包間溫度逐漸升高,導致一機房包間溫度達到臨界值觸發消防系統噴淋,電源柜和多列機柜進水,部分機器硬件損壞,增加了后續恢復難度和時長。

改進措施:

加強機房服務商管理,梳理機房溫升預案及標準化執行動作,明確溫升場景下的業務側關機和機房強制關電的預案,力求更簡單有效,并通過常態化演練強化執行。

3、客戶在香港地域新購ECS等管控操作失敗

原因分析:

ECS管控系統為B、C可用區雙機房容災,C可用區故障后由B可用區對外提供服務,由于大量可用區C的客戶在香港其他可用區新購實例,同時可用區C的ECS實例拉起恢復動作引入的流量,導致可用區B管控服務資源不足。

新擴容的ECS管控系統啟動時依賴的中間件服務部署在可用區C機房,導致較長時間內無法擴容。

ECS管控依賴的自定義鏡像數據服務,依賴可用區C的單AZ冗余版本的OSS服務,導致客戶新購實例后出現啟動失敗的現象。

改進措施:

全網巡檢,整體優化多AZ產品高可用設計,避免出現依賴OSS單AZ和中間件單AZ的問題。

加強阿里云管控平面的容災演練,進一步提升云產品高可用容災逃逸能力。

4、故障信息發布不夠及時透明

原因分析:

故障發生后阿里云啟動對客釘群、公告等通知手段,由于現場冷機處理進展緩慢,有效信息不夠。Status Page頁面信息更新不及時引發客戶困惑。

改進措施:

提升故障影響和客戶影響的快速評估和識別拉取能力。

盡快上線新版的阿里云服務健康狀態頁面(Status Page),提高信息發布的速度,讓客戶可以更便捷地了解故障事件對各類產品服務的影響。

15.5小時!阿里云史上最長大規模中斷:官方公告四大問題

本站所有文章、數據、圖片均來自互聯網,一切版權均歸源網站或源作者所有。

如果侵犯了你的權益請來信告知我們刪除。郵箱:business@qudong.com

標簽: 阿里 阿里云

相關文章

久久在线视频在线_欧美在线一级va免费观看_欧美日韩国产在线一区_亚洲一区二区三区在线观看视频
亚洲一二三四久久| 欧美日韩国产三级| 日韩视频免费观看| 制服丝袜亚洲播放| 亚洲国产高清在线| 一区二区三区产品免费精品久久75 | 久久精品成人一区二区三区蜜臀| 欧美怡红院视频| 亚洲视频自拍偷拍| 久久综合影视| 久久久久这里只有精品| 国产精品久久午夜| 亚洲精选在线观看| 亚洲精品乱码久久久久久按摩观| 亚洲欧美在线免费| 亚洲欧美国产日韩天堂区| 理论片一区二区在线| 久久人人看视频| 亚洲精选视频在线| 亚洲国产精品精华液网站| 欧美中文字幕| 久久久久久久网| 亚洲国产经典视频| 久久精品人人做人人爽电影蜜月| 欧美亚洲视频| 激情欧美丁香| 欧美本精品男人aⅴ天堂| 亚洲国产精品t66y| 91久久久一线二线三线品牌| 欧美岛国激情| 日韩视频―中文字幕| 西瓜成人精品人成网站| 国语自产精品视频在线看8查询8| 欧美一级淫片aaaaaaa视频| 久久久久久久久一区二区| 尤物视频一区二区| 欧美肥婆在线| 亚洲免费在线精品一区| 老司机精品导航| 亚洲一区观看| 在线国产日韩| 国产精品入口66mio| 久热成人在线视频| 亚洲欧美成人一区二区在线电影| 久久综合久色欧美综合狠狠| 一区二区三区高清不卡| 在线观看亚洲精品| 国产日韩欧美电影在线观看| 免费中文日韩| 久久久久网址| 久久久蜜桃一区二区人| 亚洲综合激情| 亚洲女女女同性video| 99精品国产在热久久| 亚洲国产精品久久久久久女王| 欧美一区二区视频97| 午夜日韩视频| 亚洲女优在线| 亚洲大胆美女视频| 亚洲电影在线播放| 亚洲国产精品第一区二区| 国产视频精品网| 国内精品久久久久久久影视蜜臀 | 欧美日韩一级大片网址| 欧美大片91| 欧美日韩精品一本二本三本| 欧美高清在线视频| 欧美特黄一级大片| 国产欧美日韩综合一区在线播放| 国产精品爽黄69| 1024亚洲| 亚洲一区欧美| 欧美一区二视频在线免费观看| 久久精品国产77777蜜臀| 老司机67194精品线观看| 91久久国产综合久久91精品网站| 日韩特黄影片| 久久中文字幕一区二区三区| 欧美成人综合在线| 国产区精品视频| 亚洲区免费影片| 久久久久久久综合日本| 亚洲欧洲美洲综合色网| 午夜在线视频一区二区区别| 麻豆精品一区二区av白丝在线| 国产精品嫩草影院av蜜臀| 亚洲人成在线观看一区二区| 欧美一二三区精品| 亚洲韩国日本中文字幕| 香蕉尹人综合在线观看| 国产精品久久午夜夜伦鲁鲁| 亚洲人成在线观看| 免费在线看成人av| 久久一区二区三区国产精品| 国产免费亚洲高清| 一区二区三区日韩在线观看| 久久综合九色99| 国产一区二区三区在线观看免费视频 | 欧美日韩精品一本二本三本| 精品99一区二区三区| 久久久91精品国产| 欧美一区二区三区久久精品茉莉花| 欧美日产在线观看| 日韩午夜剧场| av成人福利| 国产精品视频一| 久久青青草原一区二区| 久久久中精品2020中文| 亚洲经典自拍| 亚洲精品久久久久久下一站| 欧美性开放视频| 老司机免费视频一区二区| 欧美aa国产视频| 久久成人免费视频| 久久免费精品视频| 亚洲主播在线播放| 久久久www成人免费无遮挡大片 | 欧美mv日韩mv国产网站app| 在线一区二区三区做爰视频网站| 亚洲精品一区在线观看| 国产欧美日韩视频一区二区| 亚洲电影欧美电影有声小说| 欧美视频不卡| 亚洲精品偷拍| 曰韩精品一区二区| 欧美一区二区三区电影在线观看| 亚洲国产另类 国产精品国产免费| 亚洲午夜免费视频| 亚洲一级黄色av| 欧美国产第二页| 欧美成人免费播放| 亚洲专区一区二区三区| 亚洲深夜福利网站| 亚洲伊人伊色伊影伊综合网| 久久先锋影音| 欧美大胆a视频| 亚洲激情电影在线| 久久综合免费视频影院| 久久精品综合一区| 精品91视频| 牛牛精品成人免费视频| 亚洲国产精品日韩| 日韩一级片网址| 欧美日韩国产色视频| 一区二区激情视频| 亚洲欧美综合精品久久成人 | 亚洲淫性视频| 国产精品日韩久久久久| 国产一区二区三区在线观看网站 | 亚洲第一在线综合在线| 欧美精品在线一区二区| 亚洲专区一区二区三区| 嫩草影视亚洲| 在线视频欧美日韩| 精品51国产黑色丝袜高跟鞋| 美女图片一区二区| 亚洲你懂的在线视频| 亚洲第一福利视频| 欧美一区二区三区四区在线观看地址 | 欧美一级二级三级蜜桃| 亚洲第一黄网| 国产欧美一区二区精品婷婷| 久久深夜福利免费观看| 国产一区二区观看| 国产精品国产三级国产aⅴ无密码 国产精品国产三级国产aⅴ入口 | 欧美美女福利视频| 久久国产精品毛片| 亚洲视频999| 91久久在线观看| 免费日本视频一区| 久久精品欧美| 欧美一区二区三区成人| 麻豆精品一区二区综合av| 亚洲私人影吧| 夜夜嗨一区二区| 一区二区三区毛片| 亚洲美女色禁图| 日韩视频不卡中文| 宅男精品导航| 亚洲一线二线三线久久久| 亚洲少妇自拍| 午夜精品99久久免费| 亚洲欧美在线免费| 久久精品久久综合| 欧美成年人在线观看| 欧美日韩成人综合| 国产精品极品美女粉嫩高清在线 | 在线亚洲欧美专区二区| 亚洲综合色视频| 久久人人精品| 最新69国产成人精品视频免费| 亚洲精品国产视频| 亚洲图片欧美午夜| 欧美一区二区三区男人的天堂| 久久婷婷蜜乳一本欲蜜臀| 欧美国产视频一区二区| 国产精品日本一区二区| 精品91在线| 亚洲一区亚洲二区| 欧美不卡视频|