国产一级一区二区_segui88久久综合9999_97久久夜色精品国产_欧美色网一区二区

掃一掃
關注微信公眾號

大數據成本會迅速攀升
2012-09-10   企業網

對于大數據市場的好消息是,我們一般都同意大數據的定義,也就是眾所周知的 volume、velocity 、variety 和企業需要收集、存儲、管理和分析以獲取商業上的value,被歸納為“4V”。

當你開始你的的大數據旅程或項目時,一定要弄清楚究竟是什么業務需要。

對于大數據市場的好消息是,我們一般都同意大數據的定義,也就是眾所周知的 volume、velocity 、variety 和企業需要收集、存儲、管理和分析以獲取商業上的value,被歸納為“4V”。但你一旦開始探究旁邊的"V"所代表的真正價值時,你會發現這個定義過于廣泛,它對于不同的人意味著不同的事。說實話,對于不同企業容量也意味著不同。對于有些人來說,是在他們的BI環境中超過10 TB的管理數據,對于其他人來說可能是PB級別。數十億的日常記錄以同樣的速率通過各種外部和內部網絡進入企業。當它真的發生的時候,每個企業的情況會有很大的不同,不僅從規模和速度的角度,更重要的是從業務需求方面來看。一家大型銀行的大數據問題跟一個在線零售商或者航空公司可能是非常不同的。如果把公用事業提供商運行的智能電網或電信運營商和一家醫院正在試圖收集分析的所有患者的傳感器數據對比一下,真的,你可以把它們都歸類為機器生成的原始數據,但確切的數據類型可能是不同的,更不用說容量或者增長率。大概在上述所有行業中,一個獨特的共同點是都會保留較長時間數據周期的數據,沒有人把它扔了----甚至沒有詳細的數據。

許多成本要考慮的因素

取決于IT預算分配的分配不同,成本也會有所不同。但無論該公司如何分配IT預算,新的大數據舉措都是需要考慮的。讓我們面對現實吧,企業不會因為新的IT資產或系列產品而增加預算,當前世界經濟形勢也不建議如此。更可能的是現有預算重新被分配,而不是花費更多?,F有的傳統數據倉庫或者裝置資金被分配到新的項目上運行新的開源項目,其中包括Apache的Hadoop。它易于規模且成本低,更明顯的是有最好的方法來管理和分析結構化的數據集。然后出現的困難是你怎么整合或讓你的Hadoop環境與建立的BI及DW環境并存。

充分利用你已經擁有的

讓我們假設如今你有一個數據倉庫或數據集,你已經在使用各種ETL或數據移動工具、BI儀表板、分析或報告工具,你不希望擾亂企業用戶不僅影響性能水平,但也有了一套新的工具,事實上,你可能已經依賴于各種業務報表和KPI嚴格的SLA響應時間。然而,業務同時要求訪問新的數據集以搜集更好的見解,也可以直接分析這些數據或將它與現有客戶數據混合。這可能采取網絡日志、點擊流數據及各種互動網站跟蹤得來的社交媒體數據形式。只是無法避免影響利潤率和獲得競爭優勢的承諾。

數據是大企業,但也有嚴格的要求

眾所周知,傳統的關系型或柱狀數據庫不能處理非結構化數據類型,它需要推出一個不同的解決方案以滿足業務需求。 評估可以采取多種形式,但通常從Hadoop發行版開始,除了MapReduce之外,還有NoSQL或NewSQL數據庫查詢訪問工具。這當然是不容易的事,因為有大量的技術解決方案目前在市場上的聲稱上能運行或使用Hadoop提供的MapReduce和SQL類似的功能。它提供所有滿足需求管理卷的非結構化數據。一些比別的更成熟,一些行之有效,但不都是低成本的。開放源碼表面上看起來,一旦成本非常低,一旦你需要任何級別的支持,讓我們面對現實吧,一旦它依賴關鍵業務環境,你將需要在預算上分配一條業務線。大數據的業務線不會只有一條,因為它需要包括所需的所有組件去適當的展示大數據解決方案并切實滿足業務需求。就像其他IT環境明顯的組件將包括:軟件授權和支持、硬件、技術專用資源、專業服務和培訓,企業用戶提供專門的時間在關鍵的要求(指定類型的報表,查詢和分析)上。隨著時間的推移,這自然也會發生變化。

大數據成本會迅速攀升

從硬件所需開支方面管理新的大數據集,你可能會開始使用Hadoop集群是10個節點,這當然是可管理的,但如果你的數據速度是相當數量的,可以迅速達到100個以上的節點,現在你將面臨諸多其他費用包括額外的員工和技術資源管理環境,潛在的軟件等。你可能還需要一個商業工具提供的前端GUI儀表板追蹤特定的關鍵績效指標或者數據可視化工具好讓企業用戶可以很快明白是怎么回事。有關存儲和硬件成本越來越少,圍繞軟件,專注于這個新數據集獲得的最大價值。無可否認,大數據帶來了巨大的新的機會,但在快速的時間內達到可量化的投資回報率的角度來說仍然是一個非常現實的挑戰。每個人都在談論大數據,所有的創新技術解決方法用于解決它,但仍然是很難找到任何一個行業內很多企業的成功案例。它仍然是相當不成熟,但好消息是,在當今它以比IT其他項目更快的速度發展,數據倉庫和BI在過去二十年提供了經驗教訓。

[page]

對于大數據市場的好消息是,我們一般都同意大數據的定義,也就是眾所周知的 volume、velocity 、variety 和企業需要收集、存儲、管理和分析以獲取商業上的value,被歸納為“4V”。

大數據是大企業,但它配備了嚴格的要求

如果我們想更仔細地檢測一個大項目主要支出領域,最好看看特定類型的業務和使用情況。讓我們以一家大型金融機構為例,它擁有一批現有的傳統數據倉庫/ BI環境,業務不希望扔掉任何數據 ,且企業要為持續的趨勢和分析保留特定的數據集。這包括需要研究的問題,如“在特定的周期與客戶統計里,什么是低風險客戶的消費行為模式” 這將有利于機構更好地針對市場進行特定細分??紤]到數據增長,而IT預算不允許增加,需要減少成本,使用低規模成本的Hadoop環境,事實上它可以通過捕捉半結構化和非結構化數據來洞察客戶動態。企業用戶希望訪問Hadoop環境和現有的傳統數據倉庫環境。由于我們正在談論金融機構,安全性和可用性最為重要。同時,如果企業的用戶要訪問數據,SQL查詢訪問和使用BI工具,對新一組數據也是有要求的。如果你能避免頻繁地從一個地方移動大量的數據到另一個,它成本會降低。在理想情況下,能利用你已設置的技能和避免工作重復是關鍵。


下面是一個快速列表,列出主要成本因素和要考慮的一些意見,對這些方面可以降低成本:

  總結:考慮所有因素和獲得商業支持


大數據基本上是一個商業問題,如果你開始考慮, “通過收集,存儲和分析新數據集,什么是企業想要達到的目標” 你會開始正確的道路,實現業務收益。無論是外包,還是引進外部顧問和供應商管理項目,同樣的問題都會出現,充分利用你已擁有的現有IT環境和技能,將能夠更好地控制成本。此外,我們都愛創新技術的承諾,包括Hadoop和MapReduce,但都沒有長久的測試和標準來檢驗,所以無論從技術上或經濟上都不會有太大的意義。當你開始你的的大數據旅程或項目時,一定要弄清楚究竟是什么業務需要。我們都知道,企業用戶購買和成功部署是成功的一半。

熱詞搜索:

上一篇:大數據炒作還是利用?
下一篇:傳微軟Windows部門拆分 分別負責Win 8和9

分享到: 收藏
主站蜘蛛池模板: 东乌| 博白县| 东城区| 无极县| 三江| 台州市| 六枝特区| 英山县| 洛川县| 綦江县| 安达市| 红原县| 中山市| 南木林县| 吉林市| 福泉市| 威海市| 公主岭市| 辛集市| 南城县| 旬阳县| 健康| 锡林浩特市| 泾源县| 阿鲁科尔沁旗| 新邵县| 日照市| 阳泉市| 黄大仙区| 陵川县| 米泉市| 曲靖市| 太湖县| 舞钢市| 鞍山市| 达拉特旗| 文安县| 伊宁市| 屏东市| 苏州市| 宝丰县|