核心網(wǎng)產(chǎn)品范圍包括從無(wú)線接入后的所有管道和話音交換等設(shè)備,網(wǎng)元種類(lèi)多,相互之間的接口和信令交互復(fù)雜多樣。一個(gè)典型的VoLTE系統(tǒng),涉及40多個(gè)邏輯網(wǎng)元、60多個(gè)接口,KPI數(shù)量多達(dá)30000。云化后,系統(tǒng)分層解耦變得更加復(fù)雜,潛在的故障點(diǎn)更多,需要監(jiān)控的KPI數(shù)量更多,運(yùn)維的難度指數(shù)級(jí)增加。從實(shí)際案例分析,一些棘手的故障問(wèn)題難于用傳統(tǒng)手段檢測(cè)和發(fā)現(xiàn),比如靜默故障,其特點(diǎn)是系統(tǒng)關(guān)鍵KPI指標(biāo)無(wú)異常,事故爆發(fā)突然,不能快速定界定位,造成大面積業(yè)務(wù)受損。
沈潔表示:
華為云化核心網(wǎng)智能運(yùn)維解決方案將機(jī)器學(xué)習(xí)與專(zhuān)業(yè)知識(shí)有機(jī)結(jié)合,通過(guò)全量KPI動(dòng)態(tài)偏差計(jì)算與根因分析快速識(shí)別各類(lèi)靜默故障,變‘事后運(yùn)維’為‘事先預(yù)測(cè)’,大幅提升運(yùn)維效率和網(wǎng)絡(luò)可靠性。”

沈潔在SDN NFV世界峰會(huì)上進(jìn)行主題分享
全量KPI動(dòng)態(tài)偏差計(jì)算:運(yùn)用實(shí)時(shí)流數(shù)據(jù)處理技術(shù),采集和預(yù)處理大量的KPI及metric指標(biāo),學(xué)習(xí)其內(nèi)在變化規(guī)律,為每一個(gè)KPI及metric訓(xùn)練出對(duì)應(yīng)的動(dòng)態(tài)異常檢測(cè)模型。該模型具有良好的通用性,能根據(jù)輸入KPI的特點(diǎn),合理計(jì)算KPI數(shù)據(jù)在季節(jié)性、周期性、變點(diǎn)、節(jié)假日、重大事件等不同場(chǎng)景中的有效偏差,降低誤判和漏判,準(zhǔn)確檢測(cè)出異常。
基于專(zhuān)家經(jīng)驗(yàn)系統(tǒng)的根因分析:在探測(cè)出異常以后,系統(tǒng)將基于專(zhuān)業(yè)領(lǐng)域知識(shí)與皮爾松關(guān)聯(lián)、隨機(jī)森林等機(jī)器學(xué)習(xí)算法的深度結(jié)合生成的決策樹(shù),對(duì)多個(gè)異常KPI進(jìn)行關(guān)聯(lián)分析,給出根因 KPI排序推薦,有效降低定位定界難度,實(shí)現(xiàn)故障快速定位。
在涉及50個(gè)IMS網(wǎng)元,90個(gè)EPC網(wǎng)元商用VOLTE網(wǎng)絡(luò)中對(duì)智能化運(yùn)維解決方案的驗(yàn)證顯示,基于全量KPI動(dòng)態(tài)偏差計(jì)算與根因分析的智能運(yùn)維解決方案異常檢測(cè)準(zhǔn)確度可達(dá)85%,且90%故障可自動(dòng)快速完成定界。
目前,華為云核心網(wǎng)在全球正式商用100多張?jiān)苹W(wǎng)絡(luò),多個(gè)網(wǎng)絡(luò)服務(wù)千萬(wàn)用戶(hù)。未來(lái),華為云核心網(wǎng)將持續(xù)創(chuàng)新,不斷深化自動(dòng)化和AI技術(shù)的應(yīng)用,實(shí)現(xiàn)核心網(wǎng)絡(luò)運(yùn)維效率的倍增,打造“永不故障”的自治網(wǎng)絡(luò)。