源端重復數據刪除是指冗余數據在數據通過網絡發送到備份服務器之前就被刪除掉了。看上去這似乎是刪除冗余數據最合理的位置,然而,如果沒有挑戰的話確實是這樣的,我們將討論的過程中嘗試解決這些問題。
源端重復數據刪除的好處在于,在初始備份完成之后只發送唯一的數據。這既可以通過傳統重復數據刪除流程完成,也可以通過塊級的增量備份。利用這種重復數據刪除技術,整個流程會將信息變量與已經發送到備份目標的信息進行對比,但是這個對比通常是涉及所有數據的,從多個來源一直到這個目標。例如,如果服務器A和服務器B保存了一份相同的文件,當輪到服務器B發送這份文件的時候,它無需這么做,因為服務器A已經發送過了。我們可以把源端重復數據刪除看作是在整個企業內進行對比以在數據發送之前刪除冗余數據。
在初始備份之后,塊級增量(BLI)備份也只發送增量信息。不過,這些增量片段通常是與文件系統設置的塊分區相關的。塊級增量備份會對他們在備份目標進行保護的系統保留一個鏡像。他們通常是卷到卷的匹配技術,而不是重復數據刪除技術。其中大多數采用了某種快照技術來提供時間點后退功能。出于營銷的原因,提供了塊級增量備份解決方案的廠商希望在重復數據刪除領域也有所涉足。他們的技術避免了對冗余備份的需求,而且數據量也小于典型的增量,因為他們只發送和保存變更塊而不是整個文件。最后,一些廠商還做后處理的重復數據刪除。
關于源端重復數據刪除有一個問題,那就是重復數據刪除對比步驟對客戶方面有什么影響?在前期準備過程中我們所接觸的所有廠商都宣稱“對客戶幾乎沒有什么影響”。你需要自己驗證這個說法。我們只能說,這個問題不像前幾年那么嚴重了。客戶端軟件逐漸成熟,客戶端提供的處理資源也比以前多很多。
通過實驗室測試和用戶實踐我們發現,重復數據刪除所帶來的影響大約在5%~10%。因為塊級增量備份技術是很穩定的數據片段并且只是卷到卷的對比,所以不要求那么多的CPU資源。而且,很多文件系統通過API為請求軟件提供了一個變更塊的名單。但是,塊級增量備份卻不具備企業內數據削減功能,除非使用單獨的后處理重復數據刪除技術。
塊級增量備份和源端重復數據刪除都有一個挑戰,那就是你必須變更備份應用。有些情況下,這是一個顛覆性的變更:新廠商、新軟件、新應用代理,一切都是新的。在其他情況下,這是在現有備份應用基礎上的增值功能,你需要變更的只是數據交付技術。
源端重復數據刪除對于你的環境來說有意義嗎?你必須考慮到自身的環境以作出決策。