做好系統(tǒng)和應(yīng)用維護(hù)勢在必行
如何做好IT系統(tǒng)的運(yùn)行維護(hù)是IT領(lǐng)域的熱點(diǎn)問題. 隨著信息化技術(shù)的蓬勃發(fā)展,信息化建設(shè)的深入,運(yùn)維管理的難度也越來越大。 如何管理好IT系統(tǒng),保證其可用、安全、可靠、高效地運(yùn)行,提高用戶滿意度、降低運(yùn)維服務(wù)成本、保證系統(tǒng)能夠在遇到突發(fā)事件時(shí)快速地解決。是當(dāng)下嚴(yán)峻而又現(xiàn)實(shí)的問題。
作為運(yùn)維服務(wù)提供者,無論是管理人員還是運(yùn)維人員,經(jīng)常會(huì)遇到這樣的情景:
夢深時(shí)分,急促的鈴聲響起,電話接通,在電話的另一頭,有人急切地說道:“一位公司領(lǐng)導(dǎo)反映,公司的網(wǎng)站登錄不了,郵件無法正常發(fā)送,首頁顯示空白”,一般這種情況下,你會(huì)要求現(xiàn)場人員嘗試恢復(fù)服務(wù),但現(xiàn)場人員往往不能獨(dú)立解決,此時(shí)你需要協(xié)調(diào)技術(shù)專家去出面搞定這個(gè)問題,但如果問題棘手呢,那此時(shí)就需要綜合各方高人進(jìn)行會(huì)診。通過逐一詢問運(yùn)維組的檢查情況,細(xì)致了解了包括防火墻、入侵監(jiān)測、操作系統(tǒng)、數(shù)據(jù)庫的設(shè)置、Web服務(wù)器以及自身的運(yùn)行情況后,系統(tǒng)問題仍然無法定位。
就在你準(zhǔn)備放棄的時(shí)候,打算采取應(yīng)急方案的時(shí)候,正常的界面又忽然顯示了,只是很快,但刷新后又重復(fù)出現(xiàn)非正常。他們的聯(lián)系在哪里,問題在哪里,你得找出根本原因。
經(jīng)過多番種種努力,你忽然想到一點(diǎn),昨天客戶好像提過要對(duì)硬件做升級(jí),如果所料不錯(cuò)的話,應(yīng)該是昨天晚上就進(jìn)行了,但因?yàn)槟撤N原因,升級(jí)并沒有成功,客戶的操作步驟也沒提前通知,具體操作如何誰也不清楚。這時(shí)候你會(huì)給客戶打電話匯報(bào)情況,并要求客戶方安排人員來解決,
終于在多方人員的努力下,系統(tǒng)恢復(fù)正常運(yùn)行,大家一起舒了一口長氣,同時(shí)開始抱怨“怎么能這樣?他們也太過分了,居然進(jìn)行升級(jí)都不跟我們打個(gè)招呼,明天一定得好好的跟他們領(lǐng)導(dǎo)反映”。
以上的情景我相信絕大多數(shù)運(yùn)維服務(wù)提供者都能遇到,并且不止一次兩次。為什么會(huì)產(chǎn)生這些問題呢?如果在此次事件中,整個(gè)系統(tǒng)有了變更管理環(huán)節(jié),當(dāng)客戶進(jìn)行升級(jí),就必須通過變更管理的審核和批準(zhǔn),否則是無法進(jìn)行相應(yīng)操作的,也自然不會(huì)出現(xiàn)應(yīng)用無法訪問的問題,這對(duì)運(yùn)營維護(hù)好IT系統(tǒng)以及提供完善的IT服務(wù)有著重要的意義。
系統(tǒng)與應(yīng)用維護(hù)都有哪些困難
l 服務(wù)器操作系統(tǒng)
操作系統(tǒng)是服務(wù)器運(yùn)行的軟件基礎(chǔ),其重要性不用說大家都明白。如果使用Windows xp或Windows 2000 Server作為操作系統(tǒng),維護(hù)起來還是比較容易的,只要按時(shí)打好補(bǔ)丁,定時(shí)查看日志就可以。但如果是LINUX和UNIX操作系統(tǒng)的話,需要對(duì)運(yùn)維人員的技術(shù)有相當(dāng)高的要求,需要具備一定的專業(yè)知識(shí)。
l 服務(wù)器上的應(yīng)用維護(hù)
服務(wù)器上的應(yīng)用軟件是企業(yè)的核心數(shù)據(jù),是企業(yè)最重要的數(shù)據(jù)之一,如果數(shù)據(jù)丟失或者服務(wù)異常終止對(duì)于企業(yè)來說所造成的損失是不可估量的,企業(yè)的應(yīng)用已經(jīng)成了企業(yè)生存和發(fā)展的重要組成部分。當(dāng)企業(yè)應(yīng)用的規(guī)模越來越大時(shí),應(yīng)用也隨之越來越多,如何快速有效的對(duì)這些關(guān)鍵應(yīng)用進(jìn)行監(jiān)控就成為了迫切的問題。
l 7*24小時(shí)服務(wù)周期
除了上述二點(diǎn)列出的技術(shù)上的困難之外,還有一個(gè)重要的問題就是企業(yè)的服務(wù)器以及上面所運(yùn)行的應(yīng)用都是實(shí)時(shí)性很高的業(yè)務(wù),必須得保證7*24小時(shí)不間斷提供服務(wù),單純的靠人工維護(hù)的話實(shí)時(shí)性太差,管理員不可能一天二十四小時(shí)盯著服務(wù)器,所以在現(xiàn)實(shí)情況中,經(jīng)常出現(xiàn)服務(wù)器宕機(jī)或者服務(wù)器上的應(yīng)用不能訪問,運(yùn)維人員往往無法第一時(shí)間知曉,而是由實(shí)際使用服務(wù)器或使用應(yīng)用的人去通知,此時(shí)業(yè)務(wù)可能已經(jīng)停止了很長時(shí)間,這對(duì)于企業(yè)來說無疑是很大的損失,從而造成對(duì)IT運(yùn)維人員的滿意度下降。
系統(tǒng)和應(yīng)用誰來維護(hù),誰來管理
所謂系統(tǒng)和應(yīng)用維護(hù)就是指能夠面對(duì)并處理IT系統(tǒng)涉及到計(jì)算機(jī)所出現(xiàn)的各種故障,說白了就是軟硬兼施。故障從系統(tǒng)級(jí)到應(yīng)用級(jí),從網(wǎng)絡(luò)到硬件設(shè)備。
在系統(tǒng)和應(yīng)用維護(hù)中,人的因素至關(guān)重要。因?yàn)槲覀兌贾廊丝梢越鉀Q問題,但人又同樣會(huì)帶來問題,比如一個(gè)資深的運(yùn)維人員離崗后,問題再次發(fā)生時(shí)就很難快速響應(yīng),即使交接人技術(shù)很強(qiáng)卻也無法獲取到前人的運(yùn)維經(jīng)驗(yàn)。這使得系統(tǒng)和應(yīng)用維護(hù)管理的不穩(wěn)定因素日益增多,如何減少由人員變更導(dǎo)致得系統(tǒng)和應(yīng)用維護(hù)管理的難度加大,是擺在我們眼前而必須解決的問題。
維護(hù)管理軟件的產(chǎn)生,使得人在運(yùn)維管理中所起到的作用被量化和標(biāo)準(zhǔn)化。通過運(yùn)維管理軟件,所有IT設(shè)備都可以被監(jiān)控管理。設(shè)備遇到問題,會(huì)自動(dòng)分類報(bào)警,無論是系統(tǒng)自動(dòng)報(bào)警還是使用人工故障上報(bào),工程師只要按照系統(tǒng)相關(guān)知識(shí)庫的知識(shí),一步一步操作下去就可以,因此,對(duì)于工程師來說,不需要很高的技術(shù)水平,就可以進(jìn)行維護(hù)支持。
為了發(fā)揮IT系統(tǒng)的最大作用,系統(tǒng)和應(yīng)用不僅僅需要人的運(yùn)維,更需要有合適的維護(hù)管理軟件來支撐,幫助企業(yè)實(shí)現(xiàn)IT運(yùn)維自動(dòng)化,標(biāo)準(zhǔn)化。
通常情況下,維護(hù)管理軟件應(yīng)主動(dòng)告訴我們應(yīng)該關(guān)注什么內(nèi)容,指導(dǎo)我們?nèi)绾稳ミM(jìn)行管理,問題出在哪里,該從什么角度入手分析,主動(dòng)定位問題的位置等等。它至少應(yīng)具備以下幾個(gè)方面的特點(diǎn):
a) 提供綜合的一體化管理平臺(tái):整合網(wǎng)絡(luò)、主機(jī)、應(yīng)用、服務(wù)等各層面 IT 資源的、統(tǒng)一的IT 服務(wù)管理信息視圖。
b) 提供直觀的管理呈現(xiàn)方式:統(tǒng)一的監(jiān)控資源視圖。
c) 提供多種發(fā)現(xiàn)問題和準(zhǔn)確定位的管理機(jī)制:能夠準(zhǔn)確、快速地定位故障產(chǎn)生的根本原因。
d) 提供統(tǒng)計(jì)報(bào)告和分析圖表,方便公司領(lǐng)導(dǎo)層做出決策。
e) 保障業(yè)務(wù)系統(tǒng)的穩(wěn)定運(yùn)行:從業(yè)務(wù)角度切入,以業(yè)務(wù)為導(dǎo)向,通過對(duì)整個(gè)業(yè)務(wù)系統(tǒng)的關(guān)注,從而達(dá)到保障業(yè)務(wù)系統(tǒng)穩(wěn)定運(yùn)行和透明化管理的目的。
簡單易用的維護(hù)管理軟件的優(yōu)勢
簡單易用最主要的標(biāo)準(zhǔn),就是無需深厚技術(shù)背景,也可以輕松做好系統(tǒng)和應(yīng)用維護(hù)管理。
“哪怕是一個(gè)只有基礎(chǔ)技術(shù)能力的人,也能做專業(yè)IT維護(hù)”,這是我們維護(hù)管理軟件應(yīng)該幫助用戶達(dá)到的運(yùn)維水平。
n 監(jiān)控信息統(tǒng)一展現(xiàn)
面向業(yè)務(wù)監(jiān)控和統(tǒng)一portal展現(xiàn),整合第三方監(jiān)控系統(tǒng),提供覆蓋網(wǎng)絡(luò)、系統(tǒng)及應(yīng)用服務(wù)等全方位監(jiān)控的統(tǒng)一頁面展現(xiàn)。統(tǒng)一告警平臺(tái)匯總、壓縮和關(guān)聯(lián)各種設(shè)備或服務(wù)的告警信息,實(shí)現(xiàn)統(tǒng)一監(jiān)控和展現(xiàn)。
可針對(duì)不同角色的管理人員,提供各取所需的不同內(nèi)容。比如為部門經(jīng)理提供實(shí)時(shí)的服務(wù)儀表盤Dashboard,輔助IT決策,為運(yùn)維人員提供資源可用性與性能指標(biāo),確定資源狀態(tài)。
n 網(wǎng)絡(luò)拓?fù)鋱D
日常的運(yùn)維工作中,系統(tǒng)維護(hù)管理人員對(duì)網(wǎng)絡(luò)的監(jiān)控只是單點(diǎn)地針對(duì)設(shè)備,無法對(duì)整體進(jìn)行有效的監(jiān)控。網(wǎng)絡(luò)拓?fù)鋱D應(yīng)提供網(wǎng)絡(luò)資源實(shí)時(shí)監(jiān)控功能,能夠?qū)崟r(shí)展現(xiàn)網(wǎng)絡(luò)所有設(shè)備各個(gè)部分工作狀態(tài)變化,能真實(shí)地體現(xiàn)網(wǎng)絡(luò)中的物理運(yùn)行狀態(tài)。能夠支持自動(dòng)發(fā)現(xiàn)網(wǎng)絡(luò)拓?fù)洌仓С质止だL制各種網(wǎng)絡(luò)拓?fù)洌咕W(wǎng)絡(luò)管理員能夠更加集中、方便和有效的管理企業(yè)的網(wǎng)絡(luò)資源。
n 可視化管理
可視化管理用于對(duì)企業(yè)的各種系統(tǒng)、應(yīng)用、數(shù)據(jù)庫等資源進(jìn)行實(shí)時(shí)的性能監(jiān)控和診斷的軟件產(chǎn)品,它是個(gè)實(shí)時(shí)系統(tǒng)狀態(tài)監(jiān)控軟件,在前端交互界面上主要采用Flash 技術(shù),生動(dòng)形象的展現(xiàn)系統(tǒng)各個(gè)部分的狀態(tài)變化。
n 快速監(jiān)控
一款強(qiáng)大的網(wǎng)絡(luò)資源監(jiān)控軟件,應(yīng)能快捷易用,使用戶能夠快速上手。不但可以快速發(fā)現(xiàn)資源,而且可以立即開始監(jiān)控,使用戶可以立即查看所有資源的狀態(tài)、可用性、性能指標(biāo)取值、報(bào)警信息等等。
n Dashboard
服務(wù)Dashboard(業(yè)務(wù)服務(wù)管理儀表盤),提供對(duì)IT 基礎(chǔ)架構(gòu)的全面管理,并且能把IT 服務(wù)和相關(guān)用戶串聯(lián)連一起,提供直觀的可視化界面。一旦發(fā)生問題,系統(tǒng)管理員能很快通知受影響的客戶并及時(shí)了解服務(wù)故障嚴(yán)重程度。前端交互界面采用Flash 展現(xiàn),為用戶提供完整的信息視圖和工作平臺(tái)。
總結(jié)
一個(gè)真正綜合而全面的IT運(yùn)行維護(hù)管理軟件,才是用戶的最終選擇。它必須從用戶角度出發(fā),對(duì)業(yè)務(wù)/應(yīng)用服務(wù),及其背后的IT基礎(chǔ)架構(gòu)(路由器、交換機(jī)、服務(wù)器等)進(jìn)行全面監(jiān)控;提供保障業(yè)務(wù)的服務(wù)質(zhì)量,不僅能在服務(wù)可用性、響應(yīng)時(shí)間等方面提供良好的服務(wù)保證,還能在服務(wù)中斷時(shí),及時(shí)發(fā)出通知并解決問題。
酷點(diǎn)KoolPoint是針對(duì)企業(yè)的 IT 支持和管理部門提供的一款強(qiáng)大的監(jiān)控軟件,幫助用戶解決 IT 支持與管理過程中的難題,提高IT 服務(wù)水平和效率的產(chǎn)品。
因?yàn)橛锌狳c(diǎn)KoolPoint,無需技術(shù)你也可以輕松運(yùn)維!
更多產(chǎn)品信息,請(qǐng)登陸http://www.mochabsm.com,或撥打全國咨詢熱線400-611-5522。


