《亞利桑那州共和報》采用了DataDomain的重復數據刪除系統來減少數據存儲需求和備份成本。
《亞利桑那州共和報》存儲部門的任務既像存儲客戶又像存儲廠商。它需要備份自己的數據,還需要備份母公司(Gannett)旗下其他實體的數據。它使用多種系統和備份方式。因此,這個出版實體經常處在備份技術的前沿,比如部署重復數據刪除系統來滿足日益增長的存儲需求。
《亞利桑那州共和報》成立于1890年五月,是該州最大和最有影響力的報紙。該公司同時也是互聯網媒體的先驅,早在1995年就建立了一個網站。2000年,Gannett收購了這家報紙及其關聯的其他產業。Gannett是一家國內新聞媒體集團,旗下媒體包括《今日美國》等。
這家亞利桑那州的媒體公司現在大約有450-500臺服務器,運行著各種操作系統,如Linux,Solaris,IBM AIX,X86和VMware等。《亞利桑那州共和報》的首席系統管理員John Tabor表示:“在媒體行業,各家公司開發了許多定制的應用程序,因為我們沒有很多現成的應用程序可用。”
該公司目前管理者超過100TB的信息內容。因此,高公司使用多種備份手段和系統,比如CommVault的Simpana,EMC的Legato和Symantec的NetBackup。該媒體公司在服務器上遇到了備份時間瓶頸,大部分備份工作需要在周末進行。一些數據是每天備份,而另一些則需要每周備份。
滿足備份窗口成為一個持續性的難題,這就是為什么該出版實體很早便采用虛擬磁帶庫(VTL)系統的原因之一。2003年,《亞利桑那州共和報》決定不再采用磁帶來備份日益龐大的SAN(存儲局域網),因為磁帶這種備份方式既昂貴且耗時太長。該媒體公司選擇EMC的VTL來支持存儲網絡。
隨著該出版商增加其他的系統,比如網絡附加存儲(NAS),VTL需要備份的數據量也在不斷增加。NAS是每天備份,而該系統的數據量從4TB增加到了12TB。Tabor表示:“我們到了需要增加另一個系統的時候了。”
EMC的產品是很好,但是和許多第一代VTL一樣,它不能支持重復數據刪除。因此在2007年,這家出版公司決定選擇一個有重復數據刪除功能的VTL。《亞利桑那州共和報》將選擇范圍縮小到了Data Domain和EMC。前者提供了更為簡單的升級方式。Tabor表示:“EMC系統是‘推倒重來’的升級方式;但是如果采用Data Domain系統的話,那么我們只需要在現有系統中加入Data Domain系統而無需再購買新的磁盤。”
Data Domain系統的功能讓該出版公司覺得物有所值。新產品花費了大約12萬美元,和購買新磁盤容量的成本相近。但是由于該VTL能夠更有效地利用現有存儲,因此不用再購買新的容量。此外,支持VTL的Symantec NetBackup軟件是按照裸容量來收費而不是按照虛擬容量,因此新VTL的重復數據刪除功能讓該新聞媒體得以改善VTL存儲利用而無需增加軟件使用成本。
去年夏天,該公司購買了Data Domain系統并開始測試。測試過程進行得很順利,因此該系統很快就得以部署。Tabor表示:“我們在系統安裝的同一天就創建了VTL。”新系統提供了強大的功能,比如可以在一分鐘或更短時間內進行即時的恢復操作。
不過,該系統的部署也非一帆風順。首先,該系統不支持多路徑,而該媒體在它的冗余光纖數據中心網絡中使用了多路徑技術。這個問題很快得到了解決。在開始的時候,該媒體公司還有些擔心該系統的性能。重復數據刪除排除冗余數據,減少需要備份的數據的數量,縮短了備份時間。Data Domain在開始的時候聲稱該系統能帶來20X的提升——將100TB數據減少到10TB——但是該媒體公司只實現了7-10X的提升。在仔細分析該媒體公司提交的性能報告之后,Data Domain的技術支持人員認為一個一次性備份操作是導致結果不理想的主要原因。Tabor說:“我們出現了一次緊急事件,并使用了VTL來備份一個圖片歸檔。”在該公司第一次使用重復數據刪除功能的時候,該系統會建立必要的索引;只有在建立索引之后,性能提升的效果才能體現出來。而這個案例正是因為這個原因才顯得提升效果不明顯。
現在,該系統重復數據刪除功能的效果已經很明顯,該媒體公司正計劃擴展它的VTL。該公司計劃修改VMware備份,越過Symantec Netbackup系統,直接將它們遷移到磁盤。Tabor表示:“自從增加了重復數據刪除功能之后,我們現在的存儲管理效率大大提高。”