現狀及問題
保持業務的持續性是當今企業用戶進行數據存儲需要考慮的一個重要方面。系統故障的出現,可能導致生產停頓,客戶滿意度降低,甚至失去客戶,企業的競爭力也大打折扣。就在前不久,某網站的RAID卡的故障導致免費的主頁大部分丟失,網民們采用各種方式聲討,導致該網站的聲譽大降,一部分網民對之失去信心。因此,保持業務的持續性是用戶在選擇計算機系統的重要指標。究其根本,保護業務持續性的重要手段就是提高計算機系統的高可靠性。
高可靠性系統必須能夠解決各種導致計算機系統失效的意外情況,保護業務應用在7x24小時的時間內不間歇運行。
避免單點失效的情況出現。普通的高可靠性方案主要是利用冗余硬件設備保護用戶IT環境內某個服務器,網絡設備,如雙網卡,雙交換機等等。
避免災難發生后所導致的數據災難。即如何有效利用用戶實施的災難恢復方案在應急地點迅速地重新恢復業務應用。在這里,災難的定義主要是指自然的和人為的災難,包括系統硬件,網絡故障,機房斷電甚至火災地震,例如臺灣的臺北大地震導致該區域內建筑及大部分機器均遭到嚴重破壞。而災難發生從而引發的系統宕機的損失可能導致生產停頓,失去客戶以及減少定單、收入。根據美國有關機構統計,在美國銀行業,每次計算機系統宕機導致的損失平均為一千萬美元,這還不包括對公司聲譽的影響所導致的無形資產的損失,而采取災難恢復方案總共花費平均只有一百萬美元。
因此,高可靠性方案應該考慮到應用、數據和系統各級的保護。一個有效的高可靠性計算環境應該能夠做到:
數據中心任何計算機系統硬件,軟件,應用故障將不影響整個中心的處理工作;
數據中心由于災難(火災、地震)等原因無法工作時,應有一個備份數據中心能夠立即接管關鍵應用,繼續運行;
主數據中心恢復后,應用、數據應迅速切換回主中心運行。
解決方案
在業務中,主要是進行數據處理,關鍵數據和數據庫的備份操作已經成為日常運行處理的一個組成部分,以確保出現問題時及時恢復重要數據。但是由于通常數據采用磁帶離線備份,當數據量較大或突發災難發生時,備份磁帶無法真正及時恢復數據,所以惠普公司專門為企業用戶提供了一套完整的災難恢復方案,包括服務器,存儲設備,軟件,特別對相關的備份和災難恢復解決方案部分進行詳細闡明。
它由主數據中心和備份中心組成。主數據中心采用惠普高可靠性集群解決方案設計,備份數據中心與主中心通過光纖或電信網相連接。主中心系統配置主機包括兩臺或多臺hpUNIX服務器以及其他相關服務器,通過安裝惠普公司的MC/ServiceGuard軟件組成多機高可靠性環境。數據存儲在主中心存儲磁盤陣列XP48或XP512中。同時在異地備份中心配置相同結構的存儲磁盤陣列XP48/XP512和一臺或多臺備份服務器。主、備中心距離少于43公里時,主中心存儲磁盤陣列XP512可以通過ESCON光纖直接與備份中心的磁盤陣列XP512連接。距離較遠時,可租用電信的E1/E3信道。通過惠普提供的災難恢復軟件(HP Continuous Access XP) 可以自動實現主中心存儲數據與備份中心數據實時完全備份。在主數據中心,按照用戶要求,還可以配置磁帶備份服務器,用來安裝惠普備份軟件Omniback II,以及磁帶庫。備份服務器直接連接到存儲陣列和磁帶庫,控制系統的日常數據的磁帶備份。
方案的優點
建立災難恢復計算環境后至少具有以下優勢:
極大降低企業業務在各種不可預料災難發生時的損失,保證業務系統的7x24小時不間斷運轉。
最大限度地保護數據的實時性,完整性和一致性。業務數據是用戶最寶貴的資產之一,數據的損失就是企業資產利潤的損失,所以保護業務數據是企業計算系統的主要功能之一。實施惠普的容災方案可以將用戶數據的損失降至最低甚至為零。
為企業計算系統的正常升級,更換部件提供不停機環境。
提高企業抗變能力,增加其用戶的信心。