在Kaggle舉辦的一個(gè)有關(guān)汽車(chē)人身傷害責(zé)任險(xiǎn)的“汽車(chē)索賠預(yù)測(cè)大賽”上,202個(gè)來(lái)自全球各地的大數(shù)據(jù)分析愛(ài)好者基于Allstate提供的過(guò)去三年的車(chē)型數(shù)據(jù)、汽車(chē)配置參數(shù)和人身傷害索賠歷史數(shù)據(jù),給出未來(lái)兩年這些車(chē)型的索賠預(yù)測(cè)。這在場(chǎng)總獎(jiǎng)金只有1萬(wàn)美元的競(jìng)賽中,優(yōu)勝者給出的預(yù)測(cè)結(jié)果比贊助該賽事的汽車(chē)廠(chǎng)商的專(zhuān)業(yè)人士的預(yù)測(cè)結(jié)果準(zhǔn)確性高340%。更準(zhǔn)確的結(jié)果將有助于廠(chǎng)商改進(jìn)其產(chǎn)品,并制定更有效的定價(jià)策略。

當(dāng)大數(shù)據(jù)業(yè)余愛(ài)好者戰(zhàn)勝大型汽車(chē)企業(yè)BI專(zhuān)家的時(shí)候,我們必須承認(rèn),“大數(shù)據(jù)”絕不是企業(yè)BI產(chǎn)品的新式宣傳口號(hào),而是一個(gè)擁有無(wú)限潛能的商業(yè)財(cái)富引擎,隨著大數(shù)據(jù)相關(guān)算法、工具和技術(shù)的不斷成熟,我們已經(jīng)站到了一場(chǎng)斷層式革命的邊緣。大數(shù)據(jù)領(lǐng)域正呈現(xiàn)以下四大發(fā)展趨勢(shì):
一、計(jì)算資源的極大豐富。包括處理能力、帶寬、存儲(chǔ)、內(nèi)存性能的提升和成本的降低已經(jīng)來(lái)到了Autodesk首席執(zhí)行官Carl Bass所稱(chēng)的“無(wú)限計(jì)算”的引爆臨界點(diǎn)。
二、大數(shù)據(jù)資源極大豐富。眾所周知,過(guò)去兩年地球上新增的數(shù)據(jù)比過(guò)去人類(lèi)產(chǎn)生的所有數(shù)據(jù)之和還多。搜索引擎、博客、社交媒體、移動(dòng)設(shè)備、傳感器都在噴涌數(shù)據(jù)。過(guò)去只有企業(yè)關(guān)系型數(shù)據(jù)庫(kù)里才能見(jiàn)到的高價(jià)值數(shù)據(jù)如今已是“遍地黃金”。
三、大數(shù)據(jù)工具的不斷發(fā)展。全球企業(yè)對(duì)Hadoop狂熱追逐已經(jīng)表明企業(yè)對(duì)大數(shù)據(jù)工具和軟件的旺盛需求,這也會(huì)反過(guò)來(lái)推動(dòng)大數(shù)據(jù)工具的高速發(fā)展(例如沃爾瑪破天荒決定開(kāi)源其大數(shù)據(jù)工具)。
四、機(jī)器學(xué)習(xí)的不斷成熟。IBM的沃森電腦可以在智力搶答游戲中擊敗人類(lèi)冠軍,同樣也可以用于識(shí)別信用欺詐和預(yù)測(cè)不同車(chē)型的人身傷害責(zé)任險(xiǎn)索賠金額。


