隨著信息化建設的高速發展,用戶的業務系統也越來越依賴數據中心的服務支持。信息數據甚至已經成為了企業發展的命脈,數據安全的重要性也不言而喻。在信息化建設的初期,傳輸網絡和處理能力是我們關注的重點;而現階段數據的安全性已經成為了數據中心建設的首要考慮因素。
現有的很多技術手段可以保證數據中心內的數據安全和系統可用性。例如RAID技術、高可用系統、數據備份等等,這些技術都在數據中心范圍內保障數據安全和系統可用性。但當數據中心遭受災難時這些措施就無能為力,所有的應用和數據都會遭到損壞,系統將遭受難以估量的損失,對企業的經營活動產生巨大影響,甚至會造成企業的倒閉,此類案例多不勝數。這些教訓使人們更加重視整個數據中心的安全性和應用可持續性。容災方案就是用于解決數據中心的安全性和高可用性,保證在數據中心遭受災難時可以有災備中心繼續提供數據應用服務,使各種業務應用保持正常運轉。
近幾年來,容災已經成為信息數據中心建設的熱門課題。很多容災技術也快速發展起來,對用戶來說也有很廣闊的選擇余地。但由于容災方案的技術復雜性和多樣性,一般用戶很難搞清其中的優劣以確定如何選擇最適合自己狀況的容災解決方案。本文就各種容災方案和如何選擇合適的容災方案做一個初步探討,希望能對數據中心容災建設提供一些參考。
容災方案的分類
目前有很多種容災技術,分類也比較復雜。但總體上可以區分為離線式容災(冷容災)和在線容災(熱容災)兩種類型。
所謂的離線式容災主要依靠備份技術來實現。其重要步驟是將數據通過備份系統備份到磁帶上面,而后將磁帶運送到異地保存管理。這種方式主要由備份軟件來實現備份和磁帶的管理,除去磁帶的運送和存放外,其他步驟可實現自動化管理。整個方案的部署和管理比較簡單,相應得投資也較少但缺點也比較明顯:由于是采用磁帶存放數據所以數據恢復較慢,而且備份窗口內的數據都會丟失,實時性比較低。對于資金受限、對數據恢復的RTO(目標恢復時間)和RPO(目標恢復點)要求較低的用戶可以選擇這種方式。
在線容災要求生產中心和災備中心同時工作,生產中心和災備中心之間有傳輸鏈路連接。數據自生產中心實時復制傳送到災備中心。在此基礎上,可以在應用層進行集群管理,當生產中心遭受災難出現故障時可由災備中心自動接管并繼續提供服務。應用層的管理一般由專門的軟件來實現,可以代替管理員實現自動管理。由上面分析可見實現在線容災的關鍵是數據的復制。數據的復制有多種實現方式,也是各有利弊,后面我們深入討論。
由于在線容災可以實現數據的實時復制,因此數據恢復的RTO和RPO都可以滿足用戶的高要求。因此,數據重要性很高的用戶都選擇這種方式,比如金融行業的用戶。但要實現這種方式的容災必須有很高的投入,一般中小型企業用戶很難負擔。在方案選擇時一定要結合多方面的因素考慮。很多的用戶在初期規劃時都過于追求完美,對RTO和RPO要求過高,并不考慮自身的經濟承受能力,導致最后的預算無法負擔。所以選擇容災方案一定要結合自己的實際情況,并不一定要求無數據丟失,只要能確保在業務的可承受范圍就可以了。
數據復制的三層實現方式:
數據復制的技術也有很多,從實現復制功能的設備分布可大體分為三層。分別為服務器層、存儲交換機層和存儲層。(見上圖)
服務器層的數據復制
在生產中心和災備中心的服務器上安裝專用的數據復制軟件以實現遠程復制功能。兩中心間必須有網絡連接作為數據通道。可以在服務器層增加應用遠程切換功能軟件從而構成完整的應用級容災方案。這種數據復制方式相對投入較少,主要是軟件的采購成本。兼容性較好,可以兼容不同品牌的服務器和存儲設備,較適合硬件組成復雜的用戶。但這種方式要在服務器上運行軟件,不可避免的對服務器性能會有影響,選擇的時候請相對注意。
交換機層的數據復制
存儲交換機技術的發展使得交換機可以實現更多的功能。很多原來由服務器和存儲實現的功能現在也可在交換機層實現,比如存儲虛擬化。同樣,現在有些廠家的交換機產品已經可以實現復制功能。在生產中心和災備中心都要部署這種交換機,并在交換機之間通過專用鏈路連接起來。由于交換機可以管理和復制的數據是存放在存儲層內的。因此,用戶需要將生產數據都存儲在交換機所連接的存儲設備中,這樣就可以實現交換機對數據的管理和復制。目前使用這種技術的產品還不是很多,成熟性還有待提高,具有這種功能的交換機價格也相對較高,所以采用這種方案的用戶比較少。
存儲層的數據復制
現在的存儲設備經過多年的發展已經十分成熟。特別是中高端產品,一般都具有先進的數據管理功能。遠程數據復制功能幾乎是現有中高端產品的必備功能。要實現數據的復制需要在生產中心和災備中心都部署1套這樣的存儲系統,數據復制功能由存儲系統實現。如果距離比較近(幾十公里之內)之間的鏈路可由兩中心的存儲交換機通過光纖直接連接,如果距離在200公里內也可通過增加DWDM等設備直接進行光纖連接,超過200公里的距離則可增加存儲路由器進行協議轉換途徑WAN或INTERNET實現連接,因此從理論上可實現無限制連接。在存儲層實現數據復制功能是很成熟的技術,而且對應用服務器的性能基本沒有影響。在應用層增加遠程集群軟件后就可以實現自動災難切換的整體容災解決方案。目前這種容災方案穩定性高、對服務器性能基本無影響,使容災方案的主流選擇。
目前來看容災系統建設的成本投入還是比較可觀的。用戶在選擇容災方案的時候一定要結合自己應用環境和預算等實際情況做出決定,適合自己的才是最好的。