容災與資料保護技術
容災是企業為了保證關鍵應用在經歷災難後能夠及時恢復正常服務所進行的一系列系統計畫及建設行為。嚴格的說,容災包括基礎設施、管理體系的建設以及一系列的應急計畫。保證業務連續性是容災的最終建設目標。
為了推動企業實施災難保護工作,國家規範指明了災難恢復工作的流程、災備中心的等級劃分及災難恢復預案的制定策略。該指導性檔的推出,為企業的相關工作提供了有益的參考。
.jpg)
圖:《資訊系統災難恢復規範》定義的容災要素
容災建設的基本原則
統籌規劃原則:統籌考慮,合理佈局,通過科學的引導和調控,形成發展有序的災難恢復體系格局。
資源分享原則:災難建設要充分利用現有資源,講求實效,保證重點。在保障主要資訊系統安全的前提下,考慮災難恢復基礎設施和其他資源的充分共用,防止重複建設,避免資源浪費。
分級管理:根據資訊系統的重要性,面臨的風險大小,業務中斷所帶來的損失等因素綜合平衡安全成本和風險,確定災難恢復建設的等級,選擇合適的災難備份方案。
平戰結合的原則:一方面,加強災難恢復“平時”的應急演練,確保戰時應急恢復的系統效能;另一方面,充分利用災難備份設施的各類資源,將日常運營和應急災難備份需求結合起來,發揮更大的效益。
容災方案的規劃
不同企業的系統環境差異性非常大,從單機到大型資料中心,從單業務到複雜的多業務集成。平臺複雜度、資料複雜度、業務複雜度、管理複雜度是我們在規劃過程中需要考慮和整理的問題。方案設計過程中要根據企業的實際情況選擇一個合適的容災等級作為建設目標,產品技術的選型和管理策略的制定要與該目標相適應。
方案設計的主要考慮因素:
- 資料及系統保護的範圍
- 業務系統與容災系統之間的距離
- 業務系統與容災系統之間如何相互連接
- 資料傳送的即時性
- 允許有多少資料丟失(RPO指標)
- 容災系統接管服務的能力(RTO指標)


圖:容災等級
災備的管理和演習
容災不僅包括IT系統的建設,還要根據企業的環境、條件、人員等因素,建立一套合適的災備操作流程。而且要文件檔案化、制度化和規範化。災難的恢復要靠完善的管理體系而不是靠運氣。
演習是驗證、熟悉災備流程的必要過程。如果對災備系統的資料、功能、性能等方面沒有測試驗證,難以保證災備系統可實現資料保護和業務接管。通過演習,能夠使企業內部各部門人員不斷熟悉自己在災備計畫中所扮演的角色,做到胸有成竹,災難真正發生的時刻才能有條不紊地開展恢復工作。
主要的災備技術
資料保護技術是實施容災的基礎,通常包括備份、複製、CDP等技術,其目的是為了在資料丟失或系統發生故障時能夠對原始資料和系統進行恢復。從恢復的角度看,容災應主要關注資料的一致性和完整性,而不只是片面地追求資料無丟失。
備份:是一種定時的資料保護方式,目前主要的備份策略有三種:完整備份(Full Backup)、增量備份(Incremental Backup) 、差異備份(Differential Backup)
複製:與備份相比,複製屬於連續的資料保護,有更好的RPO指標。變化的資料被寫到檔案系統卷、日誌檔或磁片後,複製技術會即時捕獲資料或I/O的變化,然後通過網路傳送到目標容災系統。下表顯示了不同複製技術的差別。

CDP:持續資料保護CDP(Continuous Data Protection)是一種連續時間點資料保護技術,能夠捕捉到檔或資料塊的所有資料寫改動,使用前滾的方式重現任意一個時間點的資料歷史狀態。CDP結合了複製與備份技術的優點,既能即時捕捉並傳輸資料,又能進行歷史時間點恢復,代表了這兩種技術未來發展並趨於融合的趨勢。

圖:備份、複製、CDP差異比較






