国产一级一区二区_segui88久久综合9999_97久久夜色精品国产_欧美色网一区二区

掃一掃
關(guān)注微信公眾號(hào)

打造云上統(tǒng)一的數(shù)據(jù)基礎(chǔ)底座 讓大數(shù)據(jù)與機(jī)器學(xué)習(xí)互相成就
2022-05-12   企業(yè)網(wǎng)D1Net

數(shù)據(jù)是企業(yè)的一項(xiàng)重要資產(chǎn),這一點(diǎn)在業(yè)界已然達(dá)成共識(shí),但是很多企業(yè)并沒(méi)有將數(shù)據(jù)的價(jià)值充分利用。福布斯調(diào)研報(bào)告顯示,如果企業(yè)轉(zhuǎn)型成為一家數(shù)據(jù)驅(qū)動(dòng)型公司,那么在其收入增加20%的同時(shí),成本會(huì)減少30%。實(shí)際上,越來(lái)越多的企業(yè)看到了數(shù)據(jù)驅(qū)動(dòng)型組織突出的競(jìng)爭(zhēng)力,正在通過(guò)業(yè)務(wù)產(chǎn)生的數(shù)據(jù)反向驅(qū)動(dòng)企業(yè)戰(zhàn)略,通過(guò)融合大數(shù)據(jù)和機(jī)器學(xué)習(xí)能力提升業(yè)務(wù)產(chǎn)出,以充分發(fā)揮數(shù)據(jù)的價(jià)值。

IDC報(bào)告顯示,到2023年,AI系統(tǒng)支出將達(dá)到979億美元,與2019年相比增加2.5倍。據(jù)Gartner分析預(yù)測(cè),到2024年,75%的企業(yè)將把機(jī)器學(xué)習(xí)技術(shù)真正用于生產(chǎn),為業(yè)務(wù)賦能。

在近日的媒體溝通會(huì)上,亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建表示:“很多企業(yè)在業(yè)務(wù)創(chuàng)新中往往面臨一個(gè)困境,有大量的數(shù)據(jù)和分析技術(shù)儲(chǔ)備,也嘗試了很多先進(jìn)的機(jī)器學(xué)習(xí)模型,但就是很難有實(shí)際的業(yè)務(wù)產(chǎn)出,究其原因,往往缺乏云上統(tǒng)一的數(shù)據(jù)基礎(chǔ)底座。”為此,亞馬遜云科技推出“云、數(shù)、智三位一體”的大數(shù)據(jù)與機(jī)器學(xué)習(xí)融合服務(wù)組合,幫助企業(yè)推進(jìn)大數(shù)據(jù)和機(jī)器學(xué)習(xí)的融合,打通兩個(gè)領(lǐng)域的數(shù)據(jù)治理底層服務(wù),將機(jī)器學(xué)習(xí)由實(shí)驗(yàn)轉(zhuǎn)為規(guī)模化落地實(shí)踐,為企業(yè)節(jié)本增效提供業(yè)務(wù)發(fā)展的新動(dòng)力。

亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建

大數(shù)據(jù)和機(jī)器學(xué)習(xí)融合的趨勢(shì)與價(jià)值

從用戶邏輯來(lái)看,大數(shù)據(jù)和機(jī)器學(xué)習(xí)技術(shù)互相成就,大數(shù)據(jù)技術(shù)所提供的能力是機(jī)器學(xué)習(xí)建模的基礎(chǔ),而機(jī)器學(xué)習(xí)為大數(shù)據(jù)技術(shù)提供更高智能,為業(yè)務(wù)帶來(lái)更多價(jià)值。但是從技術(shù)發(fā)展的趨勢(shì)來(lái)看,這兩項(xiàng)技術(shù)走的卻是完全不同的路:大數(shù)據(jù)技術(shù)的側(cè)重點(diǎn)在于如何實(shí)現(xiàn)海量數(shù)據(jù)的采集、清洗和查詢等能力,但是機(jī)器學(xué)習(xí)更注重對(duì)算法本身的優(yōu)化。

在機(jī)器學(xué)習(xí)領(lǐng)域,算法工程師們津津樂(lè)道的是神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)、網(wǎng)絡(luò)層數(shù)、超參數(shù)的優(yōu)化等等,他們往往對(duì)數(shù)據(jù)采集、處理和優(yōu)化不是非常看重。但是,一個(gè)算法最終能否產(chǎn)生好的效果,不光取決于算法結(jié)構(gòu)的調(diào)參,對(duì)數(shù)據(jù)質(zhì)量的優(yōu)化同樣重要。當(dāng)然,在項(xiàng)目實(shí)施的過(guò)程中,僅依靠傳統(tǒng)的大數(shù)據(jù)技術(shù)無(wú)法全方位提供充足的數(shù)據(jù)見(jiàn)解,仍需要機(jī)器學(xué)習(xí)模型的能力補(bǔ)充,因此越來(lái)越多的數(shù)據(jù)項(xiàng)目要融合大數(shù)據(jù)和機(jī)器學(xué)習(xí)兩者的能力。

亞馬遜云科技大中華區(qū)產(chǎn)品部技術(shù)專家團(tuán)隊(duì)總監(jiān)王曉野在演講中提到:“大數(shù)據(jù)與機(jī)器學(xué)習(xí)的融合代表著“智能湖倉(cāng)”架構(gòu)的深度智能能力再升級(jí)。絕大多數(shù)機(jī)器學(xué)習(xí)項(xiàng)目的數(shù)據(jù)源受制于大數(shù)據(jù)平臺(tái)的數(shù)據(jù)提供能力,但是由于數(shù)據(jù)在企業(yè)中的發(fā)展階段不同,大數(shù)據(jù)團(tuán)隊(duì)往往并不能向機(jī)器學(xué)習(xí)團(tuán)隊(duì)提供有效的數(shù)據(jù)。”

結(jié)合當(dāng)前的發(fā)展趨勢(shì),亞馬遜云科技認(rèn)為:企業(yè)要重塑數(shù)據(jù)洞察,一定是將數(shù)據(jù)(大數(shù)據(jù)技術(shù))和智能(機(jī)器學(xué)習(xí)技術(shù))進(jìn)行融合和統(tǒng)一。這種融合帶來(lái)的價(jià)值顯而易見(jiàn):既能更加高效地圍繞數(shù)據(jù)構(gòu)建和實(shí)施項(xiàng)目,使得數(shù)據(jù)在兩者之間無(wú)縫流轉(zhuǎn),又能讓成員快速具備相關(guān)能力,推動(dòng)企業(yè)的數(shù)字化轉(zhuǎn)型邁向新的高度。

數(shù)據(jù)分析和機(jī)器學(xué)習(xí)融合的三大難題

陳曉建提到,數(shù)據(jù)分析和機(jī)器學(xué)習(xí)融合并非易事,必須解決三個(gè)問(wèn)題:

第一:大數(shù)據(jù)和機(jī)器學(xué)習(xí)分而治之,數(shù)據(jù)及技術(shù)孤島制約敏捷迭代。例如車企數(shù)據(jù)產(chǎn)生于生產(chǎn)制造和行車兩個(gè)環(huán)節(jié),通常是由制造部門和運(yùn)營(yíng)部門分別負(fù)責(zé),被存儲(chǔ)于不同的數(shù)據(jù)倉(cāng)庫(kù)里。機(jī)器學(xué)習(xí)要從不同的業(yè)務(wù)部門拿到數(shù)據(jù),同時(shí)還要花費(fèi)時(shí)間理解這些數(shù)據(jù)背后的定義、原因和算法,這往往是額外的負(fù)擔(dān)。

第二:數(shù)據(jù)處理能力不足,優(yōu)秀的算法要想發(fā)揮其真正價(jià)值,離不開(kāi)大量業(yè)務(wù)數(shù)據(jù)的不斷迭代。而現(xiàn)實(shí)情況是,很多機(jī)器學(xué)習(xí)團(tuán)隊(duì)不具備處理海量數(shù)據(jù)規(guī)模的能力,如果模型開(kāi)發(fā)成功后,沒(méi)有海量的運(yùn)營(yíng)數(shù)據(jù)支撐,往往無(wú)法達(dá)到預(yù)期的業(yè)務(wù)目標(biāo)。

第三:數(shù)據(jù)分析人員的參與度低。現(xiàn)實(shí)情況經(jīng)常是,模型在實(shí)驗(yàn)環(huán)節(jié)效果良好,但在實(shí)際使用中卻不盡人意,因?yàn)閷?shí)驗(yàn)環(huán)境只是對(duì)真實(shí)環(huán)境的簡(jiǎn)單模擬,而生產(chǎn)環(huán)境則要復(fù)雜得多。如果算法不給力,系統(tǒng)不給力,數(shù)據(jù)不健全,導(dǎo)致無(wú)法反復(fù)迭代,一定難以取得好的成效。

“云、數(shù)、智三位一體”的大數(shù)據(jù)和機(jī)器學(xué)習(xí)融合服務(wù)組合

為了幫助企業(yè)破解上述困境,亞馬遜云科技在其“智能湖倉(cāng)”架構(gòu)的基礎(chǔ)之上推出 “云、數(shù)、智三位一體”的大數(shù)據(jù)和機(jī)器學(xué)習(xí)融合服務(wù)組合,通過(guò)在云中構(gòu)建統(tǒng)一的數(shù)據(jù)治理底座,提供數(shù)據(jù)分析服務(wù)保障機(jī)器學(xué)習(xí)的生產(chǎn)實(shí)踐,實(shí)現(xiàn)機(jī)器學(xué)習(xí)反向賦能智能化數(shù)據(jù)分析,促進(jìn)云、數(shù)、智三者的統(tǒng)一與融合,幫助客戶推進(jìn)機(jī)器學(xué)習(xí)項(xiàng)目的落地。

在云中打造統(tǒng)一的數(shù)據(jù)基礎(chǔ)底座

陳曉建強(qiáng)調(diào):“企業(yè)實(shí)現(xiàn)數(shù)智融合最有效的途徑是在云中打造統(tǒng)一的數(shù)據(jù)基礎(chǔ)底座,如數(shù)據(jù)質(zhì)量、數(shù)據(jù)權(quán)限、數(shù)據(jù)開(kāi)發(fā)、數(shù)據(jù)工作流、可視化。在此基礎(chǔ)之上,大數(shù)據(jù)和機(jī)器學(xué)習(xí)應(yīng)該是高效充分的雙向循環(huán),雙劍合璧為企業(yè)發(fā)展提供創(chuàng)新引擎。”云中統(tǒng)一的數(shù)據(jù)治理底座不僅能提升大數(shù)據(jù)和機(jī)器學(xué)習(xí)的高效融合,還能減少重復(fù)構(gòu)建的工作,并且顯著降低成本。

亞馬遜云科技能幫助客戶構(gòu)建統(tǒng)一的數(shù)據(jù)治理底座,構(gòu)建三大核心能力:實(shí)現(xiàn)大數(shù)據(jù)和機(jī)器學(xué)習(xí)的數(shù)據(jù)共享,數(shù)據(jù)權(quán)限的統(tǒng)一管控,以及兩者統(tǒng)一的開(kāi)發(fā)和流程編排。

一是統(tǒng)一數(shù)據(jù)共享:建立統(tǒng)一的數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)質(zhì)量的標(biāo)準(zhǔn),能夠打破數(shù)據(jù)孤島,讓數(shù)據(jù)在不同系統(tǒng)間流動(dòng),實(shí)現(xiàn)數(shù)據(jù)的資產(chǎn)化;

二是統(tǒng)一權(quán)限管控:只有具備完善的細(xì)粒度的權(quán)限控制能力,才能放心的讓數(shù)據(jù)在不同的業(yè)務(wù)系統(tǒng)之間流轉(zhuǎn);

三是統(tǒng)一開(kāi)發(fā)及流程編排:融合端到端的大數(shù)據(jù)和機(jī)器學(xué)習(xí)任務(wù),能夠提升整體的開(kāi)發(fā)效率,確保數(shù)據(jù)從開(kāi)始采集到算法落地更好地為業(yè)務(wù)所用。

Amazon Lake Formation作為“智能湖倉(cāng)”架構(gòu)的核心功能,實(shí)現(xiàn)了數(shù)據(jù)網(wǎng)格跨部門的數(shù)據(jù)資產(chǎn)共享,以及基于單元格的最細(xì)粒度的權(quán)限控制機(jī)制,支持跨部門、跨地域,允許不同組織內(nèi)的機(jī)構(gòu)共享同一個(gè)元數(shù)據(jù),可讓智能營(yíng)銷項(xiàng)目或新項(xiàng)目輕松地了解自身以及其他部門擁有哪些數(shù)據(jù)可以為已所用。

通過(guò)Amazon SageMaker Studio統(tǒng)一的開(kāi)發(fā)界面,數(shù)據(jù)科學(xué)家或數(shù)據(jù)工程師可一站式地完成數(shù)據(jù)開(kāi)發(fā)、模型開(kāi)發(fā)及相關(guān)的生產(chǎn)任務(wù),該服務(wù)基于多種專門構(gòu)建的服務(wù),如交互式查詢服務(wù)Amazon Athena、云上大數(shù)據(jù)平臺(tái)Amazon Elastic MapReduce (Amazon EMR)、云數(shù)據(jù)倉(cāng)庫(kù)服務(wù)Amazon Redshift、Amazon SageMaker等,為大數(shù)據(jù)和機(jī)器學(xué)習(xí)提供統(tǒng)一的開(kāi)發(fā)平臺(tái)。

為機(jī)器學(xué)習(xí)提供生產(chǎn)級(jí)的數(shù)據(jù)處理能力

算法從實(shí)驗(yàn)走向?qū)嵺`,打磨成生產(chǎn)級(jí)業(yè)務(wù)可用的算法,最關(guān)鍵的一步是具備海量的數(shù)據(jù)處理能力。為此,亞馬遜云科技提供多種靈活可擴(kuò)展、專門構(gòu)建的大數(shù)據(jù)服務(wù),幫助客戶進(jìn)行復(fù)雜的數(shù)據(jù)加工及處理,應(yīng)對(duì)數(shù)據(jù)規(guī)模的動(dòng)態(tài)變化,優(yōu)化數(shù)據(jù)質(zhì)量。

陳曉建強(qiáng)調(diào):企業(yè)要想具備生產(chǎn)級(jí)的數(shù)據(jù)處理能力,一是通過(guò)底層大數(shù)據(jù)平臺(tái)的開(kāi)放引擎解決數(shù)據(jù)的開(kāi)放問(wèn)題,能夠?qū)Χ嘣彤悩?gòu)的數(shù)據(jù)進(jìn)行處理;二是靈活的平臺(tái),也就是具備云的彈性能力,能夠根據(jù)業(yè)務(wù)負(fù)載對(duì)底層資源進(jìn)行靈活的彈性伸縮;三是優(yōu)化數(shù)據(jù)質(zhì)量,通過(guò)采集、清洗、查詢等大數(shù)據(jù)技術(shù)能力,為機(jī)器學(xué)習(xí)提供高質(zhì)量的數(shù)據(jù)源。

據(jù)悉,Amazon Athena能夠?qū)χС侄喾N開(kāi)源框架的大數(shù)據(jù)平臺(tái)(包括Amazon EMR、高性能關(guān)系數(shù)據(jù)庫(kù)Amazon Aurora、NoSQL數(shù)據(jù)庫(kù)服務(wù)Amazon DynamoDB、Amazon Redshift)等多種數(shù)據(jù)源進(jìn)行聯(lián)邦查詢,快速完成機(jī)器學(xué)習(xí)建模的數(shù)據(jù)加工。而以Amazon Redshift、Amazon Managed Streaming for Apache Kafka (Amazon MSK)和 Amazon EMR 為代表的無(wú)服務(wù)器分析能力,可以讓客戶無(wú)需配置、擴(kuò)展或管理底層基礎(chǔ)設(shè)施,即可輕松地處理任何規(guī)模的數(shù)據(jù),為機(jī)器學(xué)習(xí)項(xiàng)目提供兼具性能和成本效益的特征數(shù)據(jù)準(zhǔn)備。

讓數(shù)據(jù)分析智能化,賦能業(yè)務(wù)人員探索創(chuàng)新

通過(guò)智能數(shù)據(jù)分析,能夠進(jìn)一步統(tǒng)一技術(shù)和業(yè)務(wù)的價(jià)值,讓研發(fā)和業(yè)務(wù)之間進(jìn)行充分合作。AI機(jī)器學(xué)習(xí)能夠豐富智能分析場(chǎng)景,更好地發(fā)揮數(shù)據(jù)的價(jià)值。亞馬遜云科技不斷提供更加智能的數(shù)據(jù)分析服務(wù),賦能業(yè)務(wù)人員通過(guò)BI可視化工具方便地調(diào)用算法,并進(jìn)一步檢驗(yàn)算法效果;甚至讓業(yè)務(wù)人員根據(jù)自身需求通過(guò)數(shù)據(jù)自己訓(xùn)練算法。

例如,在日常分析工具中集成機(jī)器學(xué)習(xí)模型預(yù)測(cè)能力,其中深度集成機(jī)器學(xué)習(xí)Amazon SageMaker模型預(yù)測(cè)能力的Amazon QuickSight 、在分析結(jié)果中添加基于模型預(yù)測(cè)的Amazon Athena ML,可幫助用戶使用熟悉的技術(shù),甚至通過(guò)自然語(yǔ)言來(lái)使用機(jī)器學(xué)習(xí)。亞馬遜云科技還提供如Amazon Redshift ML、可視數(shù)據(jù)準(zhǔn)備工具Amazon Glue DataBrew、零代碼化的機(jī)器學(xué)習(xí)模型工具 Amazon SageMaker Canvas等服務(wù),讓業(yè)務(wù)人員探索機(jī)器學(xué)習(xí)建模。

王曉野提到:在全球追求數(shù)據(jù)驅(qū)動(dòng)企業(yè)創(chuàng)新路徑的諸多企業(yè)中,寶馬集團(tuán)是其中之一,它基于大數(shù)據(jù)和機(jī)器學(xué)習(xí)融合的共同底座,通過(guò)無(wú)服務(wù)器的大數(shù)據(jù)分析和機(jī)器學(xué)習(xí)靈活的擴(kuò)展能力,讓業(yè)務(wù)人員實(shí)現(xiàn)自助式建模。寶馬集團(tuán)的第一個(gè)項(xiàng)目通過(guò)Cloud Data Hub構(gòu)建門戶網(wǎng)站的形式,將元數(shù)據(jù)在網(wǎng)站中共享;與此同時(shí)利用亞馬遜云科技Amazon Alexa和Amazon Glue等無(wú)服務(wù)器的分析工具,為業(yè)務(wù)人員提供數(shù)據(jù)處理能力,探索業(yè)務(wù)創(chuàng)新。

在對(duì)成功的機(jī)器學(xué)習(xí)項(xiàng)目規(guī)模化復(fù)制的過(guò)程中,寶馬集團(tuán)采用基礎(chǔ)架構(gòu)即代碼的方式,將一個(gè)成功的機(jī)器學(xué)習(xí)項(xiàng)目,從數(shù)據(jù)的預(yù)處理、加工清洗,到機(jī)器學(xué)習(xí)的模型訓(xùn)練再到上線,完全通過(guò)代碼方式實(shí)現(xiàn)模板化,供之后的機(jī)器學(xué)習(xí)項(xiàng)目復(fù)用。值得一提的是,寶馬也在創(chuàng)新性的使用Amazon SageMaker Canvas以及Amazon SageMaker提供的自動(dòng)機(jī)器學(xué)習(xí)能力,讓業(yè)務(wù)人員能夠自助式的從Cloud Data Hub上取得數(shù)據(jù),進(jìn)行機(jī)器學(xué)習(xí)訓(xùn)練。

最后,王曉野強(qiáng)調(diào):“機(jī)器學(xué)習(xí)和大數(shù)據(jù)的融合不是單純依靠技術(shù)就能解決的問(wèn)題,‘授人以魚’不如‘授人以漁’,因此亞馬遜云科技通過(guò)面向快速算法原型的數(shù)據(jù)實(shí)驗(yàn)室的應(yīng)用科學(xué)家、面向生產(chǎn)精度可用的模型訓(xùn)練指導(dǎo)的機(jī)器學(xué)習(xí)解決方案實(shí)驗(yàn)室,以及提供端到端咨詢及交付的專業(yè)服務(wù)團(tuán)隊(duì),通過(guò)這些不同分工的專家,和客戶肩并肩,幫助客戶探索機(jī)器學(xué)習(xí)與大數(shù)據(jù)融合時(shí)的挑戰(zhàn),共同學(xué)習(xí)優(yōu)秀企業(yè)在數(shù)據(jù)驅(qū)動(dòng)轉(zhuǎn)型成功路上寶貴的經(jīng)驗(yàn)。”

熱詞搜索:

上一篇:智能云原生應(yīng)用的崛起
下一篇: 云計(jì)算投入以及需要避免的六個(gè)最具破壞性的錯(cuò)誤

分享到: 收藏
主站蜘蛛池模板: 资阳市| 郯城县| 丽水市| 宜春市| 凤冈县| 兴仁县| 麻阳| 福安市| 娄底市| 肥东县| 林周县| 巴楚县| 昭苏县| 沙湾县| 柞水县| 巴南区| 攀枝花市| 同心县| 汝阳县| 普安县| 安新县| 阿鲁科尔沁旗| 蒙阴县| 博爱县| 凌云县| 江达县| 峨眉山市| 咸宁市| 四川省| 寿阳县| 灌云县| 呼和浩特市| 九寨沟县| 治多县| 浠水县| 云南省| 孝昌县| 洞口县| 会宁县| 郸城县| 绥化市|