国产一级一区二区_segui88久久综合9999_97久久夜色精品国产_欧美色网一区二区

掃一掃
關注微信公眾號

當前大數據技術的基礎是由誰首先提出的?
2022-03-08   網絡安全和運維

  當前大數據技術的基礎是由“谷歌”首先提出的。

  大數據(bigdata),IT行業術語,是指無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。

  在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》中大數據指不用隨機分析法(抽樣調查)這樣捷徑,而采用所有數據進行分析處理。大數據的5V特點(IBM提出):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。


  對于“大數據”(Bigdata)研究機構Gartner給出了這樣的定義。“大數據”是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力來適應海量、高增長率和多樣化的信息資產。

  麥肯錫全球研究所給出的定義是:一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力范圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類型和價值密度低四大特征。

  大數據技術的戰略意義不在于掌握龐大的數據信息,而在于對這些含有意義的數據進行專業化處理。換而言之,如果把大數據比作一種產業,那么這種產業實現盈利的關鍵,在于提高對數據的“加工能力”,通過“加工”實現數據的“增值”。

  從技術上看,大數據與云計算的關系就像一枚硬幣的正反面一樣密不可分。大數據必然無法用單臺的計算機進行處理,必須采用分布式架構。它的特色在于對海量數據進行分布式數據挖掘。但它必須依托云計算的分布式處理、分布式數據庫和云存儲、虛擬化技術。

  隨著云時代的來臨,大數據(Bigdata)也吸引了越來越多的關注。分析師團隊認為,大數據(Bigdata)通常用來形容一個公司創造的大量非結構化數據和半結構化數據,這些數據在下載到關系型數據庫用于分析時會花費過多時間和金錢。大數據分析常和云計算聯系到一起,因為實時的大型數據集分析需要像MapReduce一樣的框架來向數十、數百或甚至數千的電腦分配工作。

  大數據需要特殊的技術,以有效地處理大量的容忍經過時間內的數據。適用于大數據的技術,包括大規模并行處理(MPP)數據庫、數據挖掘、分布式文件系統、分布式數據庫、云計算平臺、互聯網和可擴展的存儲系統。

  

熱詞搜索:大數據

上一篇:大數據還沒走多遠,AI小數據時代就要來了?
下一篇:數據分析的五個步驟

分享到: 收藏
主站蜘蛛池模板: 洪雅县| 铅山县| 汾西县| 潼关县| 镇康县| 崇文区| 清新县| 扎兰屯市| 南康市| 南安市| 青川县| 肇源县| 宁陕县| 广东省| 和硕县| 津市市| 朝阳市| 茶陵县| 石阡县| 泰兴市| 桂林市| 红安县| 永平县| 唐山市| 曲阳县| 军事| 邯郸县| 木里| 廉江市| 西安市| 理塘县| 仲巴县| 儋州市| 四平市| 徐闻县| 建宁县| 罗山县| 阳原县| 紫阳县| 江阴市| 行唐县|