北京2024年4月9日 /美通(tong)社(she)/ -- 越(yue)來(lai)越(yue)多的(de)(de)(de)企業(ye)(ye)將(jiang)關鍵性的(de)(de)(de)工作負載放到云(yun)(yun)上,如何確保云(yun)(yun)上業(ye)(ye)務(wu)(wu)的(de)(de)(de)連續性即云(yun)(yun)的(de)(de)(de)韌性對企業(ye)(ye)來(lai)說就(jiu)(jiu)越(yue)來(lai)越(yue)重(zhong)要(yao)。在(zai)亞馬(ma)遜(xun)云(yun)(yun)科(ke)技(ji),我們從一(yi)開始就(jiu)(jiu)在(zai)基礎設(she)施、服務(wu)(wu)設(she)計(ji)與部署、運營模式和機制(zhi)(zhi)中(zhong)將(jiang)韌性考慮其中(zhong)。例如,亞馬(ma)遜(xun)云(yun)(yun)科(ke)技(ji)在(zai)一(yi)個區域內三個或(huo)更(geng)多可用(yong)區的(de)(de)(de)設(she)計(ji),可通(tong)過更(geng)多冗余和更(geng)好的(de)(de)(de)隔離(li)(li)來(lai)控制(zhi)(zhi)故障(zhang)的(de)(de)(de)影響面(mian)。亞馬(ma)遜(xun)云(yun)(yun)科(ke)技(ji)將(jiang)韌性根(gen)植于服務(wu)(wu)的(de)(de)(de)設(she)計(ji)之中(zhong),不同級別的(de)(de)(de)服務(wu)(wu)有對應的(de)(de)(de)、隔離(li)(li)的(de)(de)(de)控制(zhi)(zhi)面(mian)和數據面(mian),并逐層實施隔離(li)(li)。
如(ru)今,全球(qiu)數百萬用戶(hu)選擇(ze)亞馬(ma)遜(xun)云科技,包括對數據高度敏感(gan)的組織如(ru)納斯達(da)克、道瓊斯、美國金融監管局(FINRA)、默沙東等,他們信(xin)賴(lai)亞馬(ma)遜(xun)云科技提供的安全、穩定、可(ke)信(xin)賴(lai)的云服務,滿足其業(ye)務需求。
將韌性構建到亞馬遜云科技的方方面面
為(wei)(wei)構建(jian)和(he)運行世界上最(zui)可(ke)(ke)(ke)(ke)靠的(de)(de)云(yun)(yun)(yun),亞馬(ma)(ma)遜云(yun)(yun)(yun)科(ke)技(ji)持續投(tou)入,在(zai)服務(wu)設(she)計(ji)(ji)和(he)部署(shu)機制(zhi)中(zhong)構建(jian)保障措施,并將(jiang)韌性植根于運營文化之(zhi)中(zhong)。亞馬(ma)(ma)遜云(yun)(yun)(yun)科(ke)技(ji)服務(wu)的(de)(de)設(she)計(ji)(ji)中(zhong)就(jiu)考(kao)慮了(le)如(ru)何防止(zhi)中(zhong)斷和(he)事(shi)故(gu)的(de)(de)發(fa)(fa)生(sheng),因(yin)此當中(zhong)斷確實發(fa)(fa)生(sheng)時,對客(ke)戶(hu)(hu)和(he)服務(wu)的(de)(de)連續性的(de)(de)影(ying)響將(jiang)是(shi)最(zui)小(xiao)的(de)(de)。為(wei)(wei)了(le)避免單(dan)點故(gu)障,我們(men)最(zui)小(xiao)化全球基礎設(she)施之(zhi)間的(de)(de)互聯性。亞馬(ma)(ma)遜云(yun)(yun)(yun)科(ke)技(ji)全球基礎設(she)施地(di)理位置分(fen)散,遍及33個(ge)(ge)(ge)(ge)地(di)理區(qu)(qu)(qu)域(yu)的(de)(de)105個(ge)(ge)(ge)(ge)可(ke)(ke)(ke)(ke)用(yong)(yong)區(qu)(qu)(qu)。亞馬(ma)(ma)遜云(yun)(yun)(yun)科(ke)技(ji)的(de)(de)區(qu)(qu)(qu)域(yu)由(you)一個(ge)(ge)(ge)(ge)地(di)理區(qu)(qu)(qu)域(yu)內的(de)(de)多個(ge)(ge)(ge)(ge)相互獨(du)立(li),且(qie)在(zai)物理上分(fen)隔(ge)的(de)(de)可(ke)(ke)(ke)(ke)用(yong)(yong)區(qu)(qu)(qu)組成。每個(ge)(ge)(ge)(ge)可(ke)(ke)(ke)(ke)用(yong)(yong)區(qu)(qu)(qu)都有(you)獨(du)立(li)的(de)(de)電力、制(zhi)冷(leng)和(he)物理安全設(she)施,可(ke)(ke)(ke)(ke)用(yong)(yong)區(qu)(qu)(qu)之(zhi)間通過(guo)冗余(yu)的(de)(de)超(chao)低(di)延遲網絡連接(jie)。同(tong)(tong)一區(qu)(qu)(qu)域(yu)內的(de)(de)可(ke)(ke)(ke)(ke)用(yong)(yong)區(qu)(qu)(qu)之(zhi)間具有(you)足夠的(de)(de)距離,最(zui)遠可(ke)(ke)(ke)(ke)達約100公里,既能防止(zhi)相關故(gu)障,但又能實現(xian)(xian)單(dan)位毫秒級延遲的(de)(de)同(tong)(tong)步復制(zhi)。亞馬(ma)(ma)遜云(yun)(yun)(yun)科(ke)技(ji)是(shi)唯一在(zai)每個(ge)(ge)(ge)(ge)區(qu)(qu)(qu)域(yu)內提供(gong)三個(ge)(ge)(ge)(ge)或更(geng)多可(ke)(ke)(ke)(ke)用(yong)(yong)區(qu)(qu)(qu)的(de)(de)云(yun)(yun)(yun)提供(gong)商,通過(guo)更(geng)多冗余(yu)和(he)更(geng)好的(de)(de)隔(ge)離來控制(zhi)故(gu)障的(de)(de)影(ying)響面(mian)。常見故(gu)障點,如(ru)發(fa)(fa)電機和(he)冷(leng)卻設(she)備等,不會在(zai)可(ke)(ke)(ke)(ke)用(yong)(yong)區(qu)(qu)(qu)之(zhi)間共(gong)享,并且(qie)設(she)計(ji)(ji)為(wei)(wei)由(you)獨(du)立(li)的(de)(de)電力變電站供(gong)電。為(wei)(wei)了(le)獲(huo)得高可(ke)(ke)(ke)(ke)用(yong)(yong)性的(de)(de)同(tong)(tong)時可(ke)(ke)(ke)(ke)以(yi)實現(xian)(xian)更(geng)大的(de)(de)容(rong)錯能力,客(ke)戶(hu)(hu)可(ke)(ke)(ke)(ke)以(yi)將(jiang)他(ta)們(men)的(de)(de)應(ying)用(yong)(yong)程序設(she)計(ji)(ji)為(wei)(wei)在(zai)多個(ge)(ge)(ge)(ge)可(ke)(ke)(ke)(ke)用(yong)(yong)區(qu)(qu)(qu)中(zhong)運行。
韌性根植于亞馬遜云科技服務設計之中。在亞馬遜云科技構建的服務必須滿足極高的可用性目標。我們會仔細考慮我們系統所依賴的因素。即使這些依賴項受到影響,我們的設計也使我們的系統保持韌性;我們使用被稱為靜態穩定性來實現這種程度的韌性。這意味著系統以靜態狀態運行,并在發生故障或依賴項不可用時繼續正常運行,無需進行任何更改。例如,在Amazon Elastic Compute Cloud (Amazon EC2)中,實例啟動后就和數據中心中的物理服務器一樣可用。其他亞馬遜云科技資源如虛擬私有云(VPC)、Amazon Simple Storage Service (Amazon S3)存儲桶以及Amazon Elastic Block Store (Amazon EBS)卷(juan)也(ye)具有相同的特性。
賦能客戶在其所有工作中構建韌性
數(shu)百萬(wan)客(ke)戶(hu)信賴亞(ya)(ya)馬(ma)遜(xun)云(yun)科(ke)技是構(gou)建(jian)和(he)(he)運行關(guan)鍵(jian)業(ye)務(wu)(wu)(wu)和(he)(he)關(guan)鍵(jian)任務(wu)(wu)(wu)應用程(cheng)序的(de)(de)最佳(jia)場所。我們提供了(le)一套全面的(de)(de)專門(men)構(gou)建(jian)的(de)(de)服務(wu)(wu)(wu)、策略和(he)(he)架(jia)構(gou)最佳(jia)實(shi)踐,客(ke)戶(hu)可以(yi)使用這些(xie)服務(wu)(wu)(wu)、策略和(he)(he)最佳(jia)實(shi)踐來提升企(qi)業(ye)自身的(de)(de)韌性(xing)。這些(xie)服務(wu)(wu)(wu)、策略和(he)(he)最佳(jia)實(shi)踐在亞(ya)(ya)馬(ma)遜(xun)云(yun)科(ke)技韌性(xing)生命(ming)周期(qi)框架(jia)中被概述成了(le)五(wu)個階段:設定目標(biao)、設計和(he)(he)實(shi)施、評估(gu)和(he)(he)測試、運營以(yi)及響應和(he)(he)學(xue)習(xi)。彈性(xing)生命(ming)周期(qi)框架(jia)模仿標(biao)準軟件開發(fa)生命(ming)周期(qi),因(yin)此客(ke)戶(hu)可以(yi)輕松地將韌性(xing)納入現有流(liu)程(cheng)。
例如,客戶可以使用Amazon Resilience Hub來設置目標,根據這些目標評估韌性狀況,并根據Amazon Well-Architected Framework和Amazon Trusted Advisor的建議實施改進措施。在Resilience Hub中,客戶可(ke)以創建和運(yun)行Amazon Fault Injection Service實驗,這些(xie)實驗允許客戶測試其(qi)應(ying)用程序將如何響應(ying)某些(xie)類型(xing)的中斷。
其他服務,如Amazon Backup、Amazon Elastic Disaster Recovery (Amazon DRS)和Amazon Route53 Application Recovery Controller (Route 53 ARC),可以幫助客戶快(kuai)速響應(ying)和從中(zhong)(zhong)斷中(zhong)(zhong)恢(hui)(hui)復(fu)(fu)。當(dang)湯(tang)森路透(tou)(tou)(一家為(wei)超過100個國(guo)家的客戶提供稅務、法(fa)律、媒體和政府解決方(fang)案的國(guo)際(ji)媒體公司(si))希望改善(shan)其業務部(bu)門之一的數據保護(hu)和應(ying)用(yong)程(cheng)序恢(hui)(hui)復(fu)(fu)時,他們(men)采用(yong)了Amazon DRS。Amazon DRS為(wei)湯(tang)森路透(tou)(tou)提供了持續復(fu)(fu)制,因此他們(men)在源環境中(zhong)(zhong)所(suo)做的更改會(hui)在幾秒(miao)鐘(zhong)內更新到災難恢(hui)(hui)復(fu)(fu)站點(dian)。
行而不輟,未來可期
新(xin)技(ji)術、新(xin)威脅和(he)新(xin)的(de)處事(shi)之(zhi)道層出不窮。這就是亞(ya)馬遜云科技(ji)不懈(xie)努力改進基礎設施(shi)、服務(wu)設計、運(yun)營(ying)(ying)模式(shi)和(he)機制,持(chi)續加強(qiang)與(yu)發(fa)展云設施(shi)韌性(xing)的(de)原因(yin)。亞(ya)馬遜云科技(ji)將(jiang)持(chi)續為客戶(hu)提供(gong)廣(guang)泛(fan)、深入的(de)架構及運(yun)營(ying)(ying)最佳實踐服務(wu)、工具(ju)和(he)指導(dao),幫(bang)助客戶(hu)在云中構建和(he)運(yun)行彈性(xing)應用程(cheng)序。