隨著企業數位化程度越來越高,對IT與網路的依賴度也就越來越深,一旦發生地震、火災、停電、淹水等難以預測的天災人禍,IT或網路就有可能受到衝擊,一如2021年發生的513大停電事件,部份企業就因為機房停電而遺失資料,導致企業營運被迫中斷。
想要避免營運中斷、資料遺失的風險,異地備援是最好的方法之一,尤其針對重要程度高、必須24小時不停機的服務,更是要做到全系統異地備援,亦即在另一處資料中心建立與主資料中心一模一樣的系統和服務,在主資料中心因故中斷運作時,異地備援資料中心可以立即啟動,接替主資料中心繼續服務。
以HCI建置全系統異地備援,漸成主流趨勢
目前,建置全系統異地備援的方式有很多種,而採用超融合基礎架構(HCI)是相對較容易、也較具擴充彈性的做法。
某軍方單位就以Bigstack開發的CubeOS超融合雲平台作業系統做為底層架構,在距離40公里外設置一處全系統異地備援機房,透過CubeOS原生的資料同步機制,該軍方單位在主站台系統服務建置完成的同時,也一併完成了資料及服務的備援機制,且日後無論要調整服務或擴增需求,都可以在管理平台上自由更改初始設定,確保未來的使用彈性。
根據Bigstack為該軍方單位規劃的標準流程,平日會以同步鏡像複製的方式,將主資料中心裡各個VM的資料同步到備援資料中心,不只資料損失趨近於0,還能做到復原點目標(RPO)為毫秒等級、復原時間目標(RTO)為分鐘等級的服務水準,也因此,當主資料中心因故無法提供服務時,異地備援機房可以在3分鐘內接手繼續服務。
專業建議及規劃,讓異地備援機制更符合使用者期待
當然,能達到這樣的功效,除了CubeOS解決方案本身設計得當,在系統及網路層皆能滿足軍方單位對資料時間延遲(Latency)及傳輸量(Throughput)的需求外,Bigstack在過程中提供的專業建議及規劃,讓使用者在每個階段皆能了解並確認系統的功能及效能,也大大減輕導入後需要調整的可能性,讓導入過程更快速順利。
在系統建置初期,Bigstack便與軍方單位進行多次訪談,充分了解其對機房基礎建設的規劃,並提供完整的硬體需求建議及未來擴充計畫,為異地備援機制規劃最理想的部署環境。在建置過程中,Bigstack則善用CubeOS內建的網路檢測分析工具,協助軍方單位先確認整體網路符合建置條件,再進行系統建置及完成異地備援工作。
此外,為了避免系統誤判而自動切換服務可能造成的問題,Bigstack也建議該軍方單位選擇半自動接管的方式,也就是需要人為確認,服務才會從主資料中心切換到備援資料中心。在日常作業期間,IT監控中心經由儀表版觀察兩地的狀況,倘若接獲異常通知並確認主站已無法提供服務時,只要一鍵就能啟動應變機制,由備援資料中心接管服務,當主資料中心修復後,同樣可以一鍵將備援資料中心降級,將服務轉至主資料中心,又或者同時運行雙主機互為備援。
選擇CubeOS的3大原因
提及該軍方單位為何選擇CubeOS做為底層架構,主要有三點考量,第一、CP值高;第二、未來擴充彈性大,第三、可以進行更多面向的測試驗證。
先就CP值來看,CubeOS乃是以OpenInfra架構為基礎發展出的商業系統,與開源軟體相比,具備容易使用、維護方便等優勢,只要透過Bigstack定期公佈的更新包,就可以輕鬆維護,不必自行上網尋找修補程式。而若與IT大廠推出的超融合解決方案相比,不只成本相對較低,更具備擴充彈性。
延續擴充彈性來看,隨著數據量的快速增加,企業每隔一段時間就要進行硬體升級作業,才能維持系統的存取效能與空間,而在升級時,通常只能選擇同品牌更高規格的設備,並將儲存在舊設備的資料移轉至新設備。
但CubeOS以軟體定義的方式管理各項IT基礎資源,在硬體升級時,只要增加新的伺服器節點即可,省去移轉資料的程序,且沒有硬體品牌限制,任何有硬碟的X86主機都可以成為新的節點,還能藉由將設備分類分群的規劃來提升儲存效能,例如:SSD負責快取、硬碟負責存放資料。
最後就是有更多時間進行測試驗證(parallel run),CubeOS是自動化程度很高的系統,安裝與設定相當簡單快速,就目前Bigstack服務企業客戶的經驗來看,從安裝到設定最長不會超過一週,相比於很多廠牌光要花一個月左右的時間,CubeOS讓企業客戶有更多時間進行測試驗證,不只幫助企業降低導入成本,更能確保上線後的運作穩定性。
置身數位化年代,企業營運與IT和資料密不可分,運用CubeOS落實備援與備份機制,不僅確保營運穩定性,還可以縮減建置時間、滿足未來擴充需求,讓企業能夠輕鬆面對外界各種忽然其來的變化。