国产一级一区二区_segui88久久综合9999_97久久夜色精品国产_欧美色网一区二区

掃一掃
關注微信公眾號

企業用戶如何正確選擇重復數據刪除技術
2011-03-02   Watchstore

由于能夠降低成本,重復數據刪除技術是目前存儲市場上最炙手可熱的技術之一。但是它又有多種形式,如果企業想要從中選擇最適合自己的一種重復數據刪除技術,對每一種都得有所了解。

重復數據刪除技術的工作原理是,分析數據集或字節流,只存儲及/或只發送不重復的數據;重復數據由指向第一次出現的數據的指針來取代。一些IT專業人士認為,重復數據刪除和單實例存儲(SIS)是一回事,但其實并非如此。兩者的主要區別在于,SIS在文件層面分析數據流,所以如果用戶重命名了一個文件,SIS會將該文件視作新文件,因而再次存儲;如果使用重復數據刪除技術,文件的全部內部內容會被視作是重復內容。因而,SIS節省的存儲空間比較小。

數據經過所有重復數據刪除技術處理后,最終在磁盤上所占的空間小得多,但實現的方法大不相同。兩種很流行的方法分別是固定塊長度和可變塊長度;如果采用后者,重復數據刪除引擎可以改變塊大小,并且能識別更多的重復模式,因而減小了所存儲的數據量,并增加了節省的空間。嵌入式重復數據刪除技術(inline deduplication)和處理后重復數據刪除技術(post-process deduplication)也有不同的優缺點。如果采用嵌入式重復數據刪除,數據在存儲到磁盤上之前,先經重復數據刪除處理;這種方法不需要有任何額外的磁盤空間以便在重復數據刪除之前存儲數據,但是存在以下缺點:

•延長了完成備份所需的時間,導致在辦公時間備份窗口比較長,并降低了性能,另外由于前一個備份任務仍在進行,所以無法開始下一個備份任務;

•缺乏靈活性,無法允許重復數據刪除處理效果不好的數據保持非重復數據刪除的狀態;

•常常迫使用戶為了恢復單單一個文件而將整個備份內容“還原”,因而減慢了恢復速度。

如果采用處理后重復數據刪除技術,經重復數據刪除處理之前,備份內容暫時放在基于磁盤的緩存存儲器(staging storage)上;一些技術允許在緩存了一定數量的數據流后,開始進行重復數據刪除處理,這降低了對緩存存儲器大小的要求,同時允許備份盡快完成。

所以,雖然處理后重復數據刪除技術需要額外的磁盤空間用于緩存存儲區,但它能夠加快備份速度,縮小備份窗口,允許對重復數據刪除處理效果不好的數據不進行重復數據刪除處理,而且提供了更快的恢復速度。

重復數據刪除在源/客戶端或目標/存儲器上進行。源端重復數據刪除(source-side deduplication)通常使用位于客戶端的重復數據刪除引擎,該引擎會對照集中放置的重復數據刪除索引來查找重復內容,而這個索引通常放在備份服務器或媒體服務器上;只有不重復的塊才會被傳送到磁盤上。

源端重復數據刪除的優點在于,它減少了爭奪網絡資源的現象,因為通過網絡傳送的數據比較少。

不過,如果采用源端重復數據刪除技術,用戶就要為客戶端添加散列算法,這是需要大量占用處理器資源的一種算法。這意味著,原本就在超負荷運行的客戶端會變得更不堪重負,可能會導致備份速度減慢、備份窗口延長。

目標端重復數據刪除(target-side deduplication)一般更適合數據密集型環境,在存儲器層面進行重復數據刪除處理,因而不需要功能足夠強的客戶端,因為生成散列值的工作在目標這一層進行。缺點是,更多的數據將通過網絡來發送。

不同廠商提供的不同解決方案對進行重復數據刪除處理的時間和地點進行了混合搭配:比如說,一種解決方案可能在源端開始進行嵌入式重復數據刪除,另一種解決方案可能在目標端開始處理后重復數據刪除。

評估重復數據刪除技術時要考慮的最后一個標準就是,確定數據保留多長時間;分析的數據越多,發現重復數據的可能性就越大,因而節省的空間就越大。比如說,一個初始的完整備份將只對照自己來進行重復數據刪除;但是當第2周的完整備份執行完畢后,只有自第1周以來被更新或被添加的不重復數據才會存儲起來。對備份內容進行重復數據刪除處理時,此后每周的備份內容會保留起來,占用數量減少的額外磁盤空間,從而讓企業可以在現有數量的存儲器上存儲更多個備份,保持一段更長的時間,幾乎不需要從異地存儲器來恢復,除非整個站點出現了故障。

那么,總的說來,用戶在規劃重復數據刪除策略時應該考慮哪些方面?他們的目標將影響應該評估哪些重復數據刪除技術。

以下是重復數據刪除技術方面的一些典型目標和考慮因素

•最大限度地節省磁盤空間;

•重復數據刪除節省的磁盤空間比SIS更多;

•可變塊重復數據刪除技術節省的磁盤空間比固定塊重復數據刪除技術更多;

•嵌入式重復數據刪除技術降低了對磁盤空間的要求;

•源端重復數據刪除技術可以增加節省的磁盤空間;

•經重復數據刪除處理后的數據保留更長時間,這允許用戶在同樣容量的磁盤存儲器上存儲更多個備份,保留更長的時間;

•最大限度地提高靈活性;

•處理后重復數據刪除技術提供了這種功能:讓重復數據刪除處理效果不好的數據可以保持非重復數據刪除的狀態,確保了寶貴時間和處理功能沒有浪費在不會得益于重復數據刪除的數據上;

•如果采用處理后重復數據刪除技術,恢復速度更快;

•處理后重復數據刪除技術允許用戶在成本最多低至硬件存儲器十分之一的現有存儲器上存儲數據;

•更短的備份窗口;

•可以將處理后重復數據刪除安排在備份窗口之外進行;

•目標端重復數據刪除技術不會沒有必要地延長備份窗口。

重復數據刪除技術可以讓用戶大幅節省時間、人力資源,當然還有預算。

雖然這項技術在不斷發展,但如今市面上已經有幾款成熟可靠的解決方案。如果企業選擇了滿足其自身要求的合適產品,就會發現,過去很少有哪項存儲技術像重復數據刪除技術這樣可以給自己的數據中心帶來如此重大的作用。

英文原文連接:http://www.snseurope.com/news_full.php?id=16556&title=Deduplication:-the-pros-and-cons-end-users-are-not-always-told

原文鏈接:http://news.watchstor.com/industry-130443.htm

熱詞搜索:

上一篇:省錢又管用!中小企業數據備份方案導購
下一篇:為大型歸檔系統做好災難恢復規劃

分享到: 收藏
主站蜘蛛池模板: 高州市| 永德县| 黄浦区| 青冈县| 辽阳市| 营山县| 朝阳市| 大竹县| 高台县| 西藏| 襄垣县| 吴江市| 神木县| 鹤壁市| 西华县| 翼城县| 白朗县| 福清市| 富源县| 四平市| 唐山市| 化州市| 韶关市| 伊通| 乌海市| 怀仁县| 通州市| 太白县| 三穗县| 灌南县| 武义县| 潞城市| 和田市| 嘉义市| 筠连县| 叶城县| 瓮安县| 叶城县| 喀喇| 平遥县| 孟村|