源端重復(fù)數(shù)據(jù)刪除是指冗余數(shù)據(jù)在數(shù)據(jù)通過網(wǎng)絡(luò)發(fā)送到備份服務(wù)器之前就被刪除掉了。看上去這似乎是刪除冗余數(shù)據(jù)最合理的位置,然而,如果沒有挑戰(zhàn)的話確實(shí)是這樣的,我們將討論的過程中嘗試解決這些問題。
源端重復(fù)數(shù)據(jù)刪除的好處在于,在初始備份完成之后只發(fā)送唯一的數(shù)據(jù)。這既可以通過傳統(tǒng)重復(fù)數(shù)據(jù)刪除流程完成,也可以通過塊級(jí)的增量備份。利用這種重復(fù)數(shù)據(jù)刪除技術(shù),整個(gè)流程會(huì)將信息變量與已經(jīng)發(fā)送到備份目標(biāo)的信息進(jìn)行對(duì)比,但是這個(gè)對(duì)比通常是涉及所有數(shù)據(jù)的,從多個(gè)來源一直到這個(gè)目標(biāo)。例如,如果服務(wù)器A和服務(wù)器B保存了一份相同的文件,當(dāng)輪到服務(wù)器B發(fā)送這份文件的時(shí)候,它無需這么做,因?yàn)榉?wù)器A已經(jīng)發(fā)送過了。我們可以把源端重復(fù)數(shù)據(jù)刪除看作是在整個(gè)企業(yè)內(nèi)進(jìn)行對(duì)比以在數(shù)據(jù)發(fā)送之前刪除冗余數(shù)據(jù)。
在初始備份之后,塊級(jí)增量(BLI)備份也只發(fā)送增量信息。不過,這些增量片段通常是與文件系統(tǒng)設(shè)置的塊分區(qū)相關(guān)的。塊級(jí)增量備份會(huì)對(duì)他們?cè)趥浞菽繕?biāo)進(jìn)行保護(hù)的系統(tǒng)保留一個(gè)鏡像。他們通常是卷到卷的匹配技術(shù),而不是重復(fù)數(shù)據(jù)刪除技術(shù)。其中大多數(shù)采用了某種快照技術(shù)來提供時(shí)間點(diǎn)后退功能。出于營銷的原因,提供了塊級(jí)增量備份解決方案的廠商希望在重復(fù)數(shù)據(jù)刪除領(lǐng)域也有所涉足。他們的技術(shù)避免了對(duì)冗余備份的需求,而且數(shù)據(jù)量也小于典型的增量,因?yàn)樗麄冎话l(fā)送和保存變更塊而不是整個(gè)文件。最后,一些廠商還做后處理的重復(fù)數(shù)據(jù)刪除。
關(guān)于源端重復(fù)數(shù)據(jù)刪除有一個(gè)問題,那就是重復(fù)數(shù)據(jù)刪除對(duì)比步驟對(duì)客戶方面有什么影響?在前期準(zhǔn)備過程中我們所接觸的所有廠商都宣稱“對(duì)客戶幾乎沒有什么影響”。你需要自己驗(yàn)證這個(gè)說法。我們只能說,這個(gè)問題不像前幾年那么嚴(yán)重了。客戶端軟件逐漸成熟,客戶端提供的處理資源也比以前多很多。
通過實(shí)驗(yàn)室測試和用戶實(shí)踐我們發(fā)現(xiàn),重復(fù)數(shù)據(jù)刪除所帶來的影響大約在5%~10%。因?yàn)閴K級(jí)增量備份技術(shù)是很穩(wěn)定的數(shù)據(jù)片段并且只是卷到卷的對(duì)比,所以不要求那么多的CPU資源。而且,很多文件系統(tǒng)通過API為請(qǐng)求軟件提供了一個(gè)變更塊的名單。但是,塊級(jí)增量備份卻不具備企業(yè)內(nèi)數(shù)據(jù)削減功能,除非使用單獨(dú)的后處理重復(fù)數(shù)據(jù)刪除技術(shù)。
塊級(jí)增量備份和源端重復(fù)數(shù)據(jù)刪除都有一個(gè)挑戰(zhàn),那就是你必須變更備份應(yīng)用。有些情況下,這是一個(gè)顛覆性的變更:新廠商、新軟件、新應(yīng)用代理,一切都是新的。在其他情況下,這是在現(xiàn)有備份應(yīng)用基礎(chǔ)上的增值功能,你需要變更的只是數(shù)據(jù)交付技術(shù)。
源端重復(fù)數(shù)據(jù)刪除對(duì)于你的環(huán)境來說有意義嗎?你必須考慮到自身的環(huán)境以作出決策。


