ITOA是什么?
ITOA即IT運(yùn)營分析,是IT Operations Analytics的縮寫,是近幾年來IT管理和分析師報(bào)告中用的非常頻繁的一個(gè)詞語。2012年,隨著全球第一家ITOA企業(yè)Splunk的上市,并得到市場和投資者的一致認(rèn)可,ITOA迅速成為IT管理的新方向。
在ITOA之前,IT管理的重點(diǎn)是M,即監(jiān)控(Monitoring或者M(jìn)anagement),與M相關(guān)的技術(shù)和產(chǎn)品包括:BSM (業(yè)務(wù)服務(wù)管理,Business & Service Management);BTM (業(yè)務(wù)交易管理,Business Transaction Management);APM (應(yīng)用性能管理,Application Performance Management)等。M類產(chǎn)品起源于上世紀(jì)90年代,是為了解決IT配置、變更和運(yùn)行過程中發(fā)生的可用性和性能問題而產(chǎn)生的。隨著時(shí)代的變遷和技術(shù)的發(fā)展,原來的M類產(chǎn)品出現(xiàn)了以下局限性:
● 隨著云計(jì)算、虛擬化和大數(shù)據(jù)的發(fā)展,現(xiàn)代數(shù)據(jù)中心變得更加復(fù)雜和動態(tài)化,遠(yuǎn)遠(yuǎn)超出了M類產(chǎn)品的功能范圍;
● 現(xiàn)代數(shù)據(jù)中心的IT軟硬件中產(chǎn)生大量的原始數(shù)據(jù),數(shù)量從G級單位上升到PB級單位,在數(shù)量、周轉(zhuǎn)率和種類方面都遠(yuǎn)超過去,現(xiàn)有的M類產(chǎn)品無法解決這些大數(shù)據(jù)產(chǎn)生的問題;
● 移動互聯(lián)網(wǎng)和未來物聯(lián)網(wǎng)的發(fā)展,將使得大數(shù)據(jù)以指數(shù)級的方式產(chǎn)生,市場需要與大數(shù)據(jù)相適應(yīng)的新的技術(shù)手段和產(chǎn)品。
為了解決以上的問題,ITOA便應(yīng)運(yùn)而生。ITOA將IT配置、變更和運(yùn)行過程中產(chǎn)生的海量數(shù)據(jù)轉(zhuǎn)化為清晰的、可付諸實(shí)施的解決方法,企業(yè)通過使用ITOA產(chǎn)品生成的報(bào)表可以大大地縮短故障修復(fù)時(shí)間,減少事故和宕機(jī)次數(shù),平滑地實(shí)現(xiàn)無故障的應(yīng)用發(fā)布和系統(tǒng)升級。
ITOA產(chǎn)生的背景
以下三個(gè)要素是ITOA產(chǎn)生的主要驅(qū)動力:
● 復(fù)雜度,在過去的時(shí)間里,數(shù)據(jù)中心的每一層技術(shù)正在變得越來越復(fù)雜而難以控制和管理,IT設(shè)備的配置參數(shù),從少則幾十個(gè)、幾百個(gè)到多達(dá)幾千個(gè)。比如,Windows操作系統(tǒng)的配置參數(shù)在1500到2500個(gè)之間;IBM WebSphere的配置參數(shù)為1600個(gè); Oracle WebLogic的配置參數(shù)超過6000個(gè)。每一個(gè)IT設(shè)備的每一個(gè)參數(shù)如果配置錯(cuò)誤或者忘記配置,都可能給整個(gè)IT系統(tǒng)的運(yùn)行造成巨大的影響,應(yīng)用系統(tǒng)間的互相依賴使得管理和控制整個(gè)IT業(yè)務(wù)服務(wù)體系變得越來越難。2011年4月,亞馬遜Web服務(wù)宕機(jī),造成Quara、Foursquare等一批大客戶服務(wù)中斷4天。事后亞馬遜發(fā)布故障聲明稱:網(wǎng)絡(luò)升級過程中的網(wǎng)絡(luò)配置錯(cuò)誤引發(fā)了這次事故。
● 動態(tài)化,對IT運(yùn)營來說,變更是家常便飯,發(fā)生在應(yīng)用和架構(gòu)的每一個(gè)層面,幾乎影響著IT業(yè)務(wù)的每一個(gè)方面。為了迎接這些挑戰(zhàn),企業(yè)采用敏捷開發(fā)的方法來實(shí)現(xiàn)應(yīng)用的快速迭代,持續(xù)地集成和持續(xù)地更新,最多可能導(dǎo)致每天生產(chǎn)系統(tǒng)上有上百個(gè)更新。比如,eBay每年有35000個(gè)變更。IBM2011年的調(diào)查表明,50%到75%的數(shù)據(jù)中心運(yùn)行著配置落后的系統(tǒng)。
● 管理籬笆化,大部分單位都沒有一個(gè)專家來對全部應(yīng)用系統(tǒng)進(jìn)行端到端的一站式管理,應(yīng)用系統(tǒng)被部署在不同的物理和虛擬系統(tǒng)中,應(yīng)用之間通過網(wǎng)絡(luò)來進(jìn)行連接。過去的各種M產(chǎn)品各自完成對一部分應(yīng)用體系的數(shù)據(jù)和指標(biāo)的管理,沒有一個(gè)產(chǎn)品能夠從廣度和深度上覆蓋所有的IT系統(tǒng)。
要解決以上的管理難題,IT運(yùn)營不僅需要自動化的工具,更需要一體化的產(chǎn)品,能夠收集所有IT軟硬件系統(tǒng)產(chǎn)生的各種詳細(xì)數(shù)據(jù),分析所有的變更,把各種IT管理“籬笆”整合為一體。過去沒有一款產(chǎn)品是這么設(shè)計(jì)的,更不用提解決大數(shù)據(jù)的問題。
新的ITOA產(chǎn)品能夠?qū)崿F(xiàn)以下管理功能:
● 事故管理
● 問題管理
● 變更管理
● 配置管理
● 容量規(guī)劃和預(yù)測
對于IT運(yùn)營團(tuán)隊(duì)中的不同角色,ITOA產(chǎn)品幫助他們實(shí)現(xiàn)以下價(jià)值:
● 運(yùn)維團(tuán)隊(duì)——快速發(fā)現(xiàn)IT基礎(chǔ)設(shè)施故障,零時(shí)定位故障根源,降低運(yùn)行風(fēng)險(xiǎn);
● 開發(fā)團(tuán)隊(duì)——分析和診斷應(yīng)用程序缺陷,優(yōu)化代碼質(zhì)量,提高終端用戶的體驗(yàn)質(zhì)量;
● 安全團(tuán)隊(duì)——通過對海量安全日志的分析,過濾出安全事件,查找安全隱患,保障系統(tǒng)安全運(yùn)行。
ITOA的技術(shù)實(shí)現(xiàn)
根據(jù)Gartnet的分析報(bào)告,ITOA是統(tǒng)一的、一站式的大數(shù)據(jù)收集和分析系統(tǒng),從技術(shù)層面需要具備以下四個(gè)功能子系統(tǒng):
1.數(shù)據(jù)收集子系統(tǒng)——需要支持對服務(wù)器、應(yīng)用、網(wǎng)絡(luò)、存儲、虛擬機(jī)的數(shù)據(jù)收集;
2.基于非關(guān)系型的、支持巨量存儲的、高度分布式的數(shù)據(jù)庫;
3.數(shù)據(jù)分析引擎系統(tǒng);
4.展現(xiàn)層。
除以上4個(gè)必備的系統(tǒng)外,ITOA還需要具備過去M類產(chǎn)品的監(jiān)控功能。因?yàn)楸O(jiān)控是IT管理的基礎(chǔ)功能,分析是IT管理的高級功能。ITOA的分析和監(jiān)控功能結(jié)合使用,才能發(fā)揮出最大的作用。
ITOA國際和國內(nèi)市場介紹
市場對ITOA的需求從2011年開始,進(jìn)入快速發(fā)展階段。Gartner通過對企業(yè)用戶調(diào)查后,發(fā)布分析報(bào)告稱:2012年企業(yè)ITOA支出為30億美元, 2013年超過80億美元,2014年將繼續(xù)超過100%增長,經(jīng)過5年超過100%的高速增長后,到2018年成為主流市場的需求。
國際市場上的ITOA軟件產(chǎn)品供應(yīng)商主要有Splunk、Sumo Logic、LogRythm等。國內(nèi)市場目前除美信科技公司外,還沒有相關(guān)的產(chǎn)品供應(yīng)商。
美信科技從2007年開始,研究大數(shù)據(jù)監(jiān)控和分析產(chǎn)品,開發(fā)了第一代大數(shù)據(jù)處理數(shù)據(jù)庫RealDB,并于2011年正式推出美信海量監(jiān)控產(chǎn)品,美信科技是國內(nèi)該領(lǐng)域第一家正式推出海量數(shù)據(jù)監(jiān)控產(chǎn)品的廠商,到目前為止也是唯一一家。美信ITOA產(chǎn)品和Splunk相比較,有以下區(qū)別:
● 美信ITOA產(chǎn)品在監(jiān)控方面做得非常完善,有支持幾乎所有IT廠商的數(shù)據(jù)收集插件,在日志分析方面采用根據(jù)策略過濾顯示的方式,用戶可以一眼看到符合策略的日志發(fā)生在IT架構(gòu)的哪個(gè)層面;
● Splunk偏重于日志的收集,把各種日志信息收集回來建立索引進(jìn)行保存,通過搜索的方式展示結(jié)果,Splunk支持保存的日志更多,用起來更加復(fù)雜;
● 美信于2014年年底正式發(fā)布了下一代數(shù)據(jù)庫BigRiver,BigRiver添加了完善的索引功能,支持將各種結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)快速建立索引。美信2015年將基于BigRiver數(shù)據(jù)庫進(jìn)一步完善ITOA產(chǎn)品,強(qiáng)化海量數(shù)據(jù)的搜索和展現(xiàn)功能。
ITOA領(lǐng)域標(biāo)桿公司介紹
Splunk,創(chuàng)建于2003年,總部位于美國舊金山,2006年發(fā)布第一款軟件產(chǎn)品,在全球15個(gè)國家設(shè)有辦事處,擁有1000多名員工。2012年Splunk在納斯達(dá)克上市,是美國上市的第一家大數(shù)據(jù)概念公司。上市之后,截至2014年Splunk在全球有超過7000個(gè)用戶,分布在銀行、電信以及一些大型企業(yè),財(cái)富100強(qiáng)中超過一半是Splunk的客戶。2014年Splunk的營業(yè)額預(yù)計(jì)超過4億美元,目前市值超過70億美元。
Sumo Logic,創(chuàng)建于2010年,總部位于加州的Redwood市,到目前為止,得到Accel Partners、Greylock Partners和Sutter Hill Ventures累積5050萬美元的投資。Sumo Logic的業(yè)務(wù)主要是海量Log分析和管理工作,與Splunk不同之處在于,Sumo Logic以云端的SaaS服務(wù)為主。
本文作者系美信科技 胡建強(qiáng)