通信科技發(fā)展到今天,當數(shù)據(jù)量達到TB級,網(wǎng)絡(luò)傳輸?shù)男势鋵嵾€不如快遞。百兆光纖寬帶看似很快,但在遇到真正的“大數(shù)據(jù)”時,高速公路也會秒變停車場。
我們來算一筆賬:

從時間成本來看,離線數(shù)據(jù)的物理遷移看似原始實則非常高效。
就像鈔票比錢包值錢,數(shù)據(jù)比存儲設(shè)備更值錢,設(shè)備壞了可以再買,數(shù)據(jù)丟了那就是天要塌了。企業(yè)初期基本采用單數(shù)據(jù)中心運營,但業(yè)務(wù)規(guī)模上來以后,數(shù)據(jù)中心里的服務(wù)器和存儲設(shè)備越來越多,數(shù)據(jù)量也大了,這時候就要考慮建設(shè)災(zāi)備中心,構(gòu)建主備協(xié)同的雙中心架構(gòu)。在不影響業(yè)務(wù)的前提下,如何將生產(chǎn)數(shù)據(jù)中心的PB級規(guī)模數(shù)據(jù)備份到災(zāi)備數(shù)據(jù)中心呢?
按照上面的計算,完成1PB數(shù)據(jù)的全部備份耗時近3年,這個方案沒法接受。

圖1.常規(guī)數(shù)據(jù)同步方案
杉巖的數(shù)據(jù)離線遷移服務(wù),就是用來解決這個問題的。
普通的離線遷移一般是用中轉(zhuǎn)磁盤的方式實現(xiàn),如果是將對象數(shù)據(jù)拷貝到磁盤的文件系統(tǒng),會造成標簽等元數(shù)據(jù)的信息丟失,雖然數(shù)據(jù)主體是備份了,但實際上降低了數(shù)據(jù)質(zhì)量。杉巖中轉(zhuǎn)集群的方案不存在這個缺點,利用服務(wù)器搭建高密度中轉(zhuǎn)集群,同步主數(shù)據(jù)和元數(shù)據(jù),整個方案實施過程只有3步,7天即可完成。
1、部署中轉(zhuǎn)集群
根據(jù)數(shù)據(jù)量配置服務(wù)器,搭載杉巖MOS海量對象存儲軟件以構(gòu)建中轉(zhuǎn)集群。服務(wù)器的網(wǎng)絡(luò)接口規(guī)格根據(jù)數(shù)據(jù)量以及客戶對遷移時間的要求,靈活選擇千兆或萬兆網(wǎng)卡。若遷移1PB數(shù)據(jù),客戶僅需配置1臺中轉(zhuǎn)服務(wù)器,選配萬兆網(wǎng)卡,帶寬可達4GB/s。
2、數(shù)據(jù)從生產(chǎn)數(shù)據(jù)中心同步到中轉(zhuǎn)集群
在可視化管理界面上配置同步策略,將數(shù)據(jù)從生產(chǎn)數(shù)據(jù)中心同步到中轉(zhuǎn)集群,這一步只要3天就可以完成。數(shù)據(jù)同步完成之后,將中轉(zhuǎn)服務(wù)器打包快遞至災(zāi)備數(shù)據(jù)中心。視路程遠近,這一步可以在1到3天內(nèi)完成。
3、數(shù)據(jù)從中轉(zhuǎn)集群同步到災(zāi)備數(shù)據(jù)中心
中轉(zhuǎn)服務(wù)器送達后,按同樣方式反向操作即可將數(shù)據(jù)同步到災(zāi)備中心,這一步也只要3天就可以完成。至此,數(shù)據(jù)遷移全部完成,耗時最短只要7天。

圖2.數(shù)據(jù)離線遷移方案
采用杉巖離線遷移服務(wù)充分發(fā)揮分布式集群的帶寬優(yōu)勢,遷移效率可提升100倍以上。數(shù)據(jù)遷移前后,完整保留文件的標簽、多版本等數(shù)據(jù)屬性,不存在信息丟失問題,數(shù)據(jù)質(zhì)量有保證;而且中轉(zhuǎn)服務(wù)器運送過程全程監(jiān)控,保障設(shè)備和數(shù)據(jù)安全,總體成本可節(jié)約50%以上,這套方案已經(jīng)在保險公司等金融行業(yè)客戶應(yīng)用過,效果十分顯著。
計算機領(lǐng)域老前輩、Minix的作者AndrewS.Tanenbaum的這句話仍然沒有過時:“永遠不要低估一輛滿載著磁帶在高速公路上飛馳的旅行車的帶寬。”