我們也來做個相同的游戲,想想如果沒有便宜的存儲介質存在的話,今天的存儲將會如何?換句話說,如果硬盤驅動器在過去的20年間沒有經歷容量的大規模提升和價格的大幅下跌,一切將會怎樣?
當硬盤容量成為限制或者需要大量成本的時候,我們也許會更加注意數據管理。數據管理工作將會和現在大不相同,數據保存和數據凈化的過程和能力將比現有的功能強大的多。對于企業來說,只有真實有用的數據需要保存,或許支持電子證供,滿足法規遵從也就不算是一個挑戰性的任務了。
現實的情況是,由于今天我們有大量廉價的硬盤空間,現在我們對于存儲這件事已經樂此不疲了,拼命地把磁盤空間用各種各樣的數據填滿,在索引和分類等領域的應用也越來越多。
而由于受到法規遵從和控制數據運行成本的雙重驅動,如今的企業都在努力更好地控制數據,雖然最初的嘗試只是在電子郵件方面。
在企業試圖進行數據控制和管理的時候,企業會發現由于牽扯到大量的無組織數據,實際操作過程中還存在大量風險,雖然我們也有可能大幅度降低存儲這些數據所需要的容量規模。每一家企業都有大量的無組織的文件系統數據,其中有很多數據已經是歷史久遠的了,也可以說幾乎沒有什么存在的價值了。
但是我們該如何分辨這些沒有價值的數據和一些關鍵的業務數據呢?為了對歸檔的電子郵件能夠成功訪問,廠商們提供了產品的增強版本可以重新部署文件數據到價格相對低廉的存儲媒介上,并可以在需要的情況下能夠隨時訪問得到數據。
不過,這種功能很大程度上是受元數據屬性驅動的——文件類型,所有者,最后訪問時間等等——而不取決于數據自身的價值,因此,只能解決一部分的問題。
基于實際內容而做的分類是常常會出問題的,但是滿足數據真實性的需要非常重要。有些企業使用專門的文件管理程序,一本厚厚的使用手冊將十分有效,但是這種程序一般都價格不菲而且很復雜。過去的幾年間,也有一些面世的產品是基于內容的對無組織數據的索引和分類。經過了發展成熟的過程,人們現在開始高度關注這些技術,特別是在那些對于法規遵從有嚴格要求的環境中。
無組織數據的全面管理實際上需要以下三個方面的有機結合:用戶的標簽和分類,索引和自動內容分類,以及基于元數據的重定位。雖然這三個方面所占的比例由于企業需求的不同也會有所不同,我們要明確的是無組織數據的問題不能再被人們所忽略了。
拋棄大量的無價值的、無條例的無組織數據,保留和控制最為關鍵的業務數據,將成為我們的下一項挑戰。