隨著商業銀行的IT基礎建設從穩定基礎到上新臺階,越來越多的商業銀行開始想到“向管理要效益”,并逐步把客服優勢作為其核心競爭力的一部分。和國外同行相比,在管理上的差距也迫使商業銀行要向主流的國際標準平臺靠攏。這些都使得內部管理部門對IT服務管理的需求快速增長。
服務器數量的增多,應用的增多,應用復雜度的增加,均使得日常維護等管理工作變得比過去更加嚴峻和復雜,內部需求的驅動也使得這一切變得更迫切。因此,如何加強開放平臺系統的安全性、可用性,提高響應時間,提升管理效率,便成為銀行科技部門在開放平臺服務管理方面面臨的挑戰。
為了提高商業銀行IT服務管理的水平,經過多方面、多層次的驗證后,不少商業銀行選擇了ITIL作為自身IT服務管理流程的指導標準。服務器管理作為IT服務管理的一個子集,自然也應該遵循ITIL的框架標準。
ITIL作為一種全面的IT服務管理的框架標準正式發布后,已經在多個行業得到了實踐證明。遵循ITIL標準構建IT服務管理體系,確實可以有效地提高服務質量和降低運行成本。但是,ITIL是一個通用的標準,只是指引了一個大方向,這就確定了ITIL不能直接使用,而必須由企業根據自身的特點和具體實踐,在ITIL的框架內制定自己在服務管理方面的具體內容。下面結合商業銀行的特點,探究ITIL框架下的服務器管理。
1.服務等級管理
服務等級管理(SLM)是為了簽訂服務等級協議(SLAs)而進行的計劃、草擬、協商、監控和報告,以及簽訂服務等級協議后對服務品質的評價等一系列活動所組成的一個服務管理。服務等級管理旨在確保組織所需的IT服務質量在成本合理的范圍內得以維持并逐漸提高。
對商業銀行來說,可以簡單認為,科技部門是服務供應商,業務部門是客戶。過去,對于科技部門的服務水平沒有指標,對于業務部門需要的投入也沒有限定,因此雙方在服務水平和服務滿意度上有一定的分歧。現在,按照ITIL標準的指引,筆者認為,商業銀行的業務部門在IT服務上也必須具有成本意識,要和科技部門進行服務水平的約定,確定業務部門需要投入多少,以及科技部門需要達到什么樣的服務水平等。在對成本和服務水平進行界定時,各商業銀行可以考慮以下內容:明確業務部門的業務需求及相應的IT服務需求;確保以合理的成本提供約定的IT服務等級;確保實際的IT服務等級達到約定的服務等級的要求;嘗試內部收費。
2.IT服務財務管理
IT服務財務管理考慮IT資源的效率及經濟價值,旨在將基于預算的IT組織轉變為類似于商業組織的具有成本意識的組織,為用戶提供成本合理的IT服務。IT服務財務管理主要包括預算編制、IT核算和服務計費等3個子流程。
從IT服務財務管理的標準來看,各商業銀行的科技部門也必須具有成本意識。IT服務的財務管理不善,將導致IT服務成本的上升或者IT資源的浪費。此外,科技部門在強調質量的同時也必須強調效率。
對比ITIL的標準,我國商業銀行現有的IT服務財務管理還相對模糊,在未來的管理中需要考慮:根據服務等級水平的不同來制定不同的成本標準;嘗試內部成本計算,在滿足內部服務標準的前提下控制內部成本的增加;考慮和關注成本與生產運行風險的關系,盡量在成本和風險之間做好平衡。
此外,商業銀行也應進行各種研究,使用一些先進的技術手段來降低服務器的成本,如網格計算、服務器資源的整合、錯峰使用系統資源等。
3.能力管理
能力管理主要關注業務和IT基礎架構之間的關系,它不僅要評價和改進現有服務能力,而且還應分析和預測組織未來的業務需求,從而據此確定未來應當配置的服務能力的級別。
商業銀行在服務器能力管理方面,最重要的手段是定期進行健康檢查。定期對目前的服務器運行狀況進行檢查,檢查其處理能力能否滿足當前以及將來的客戶需求,并且檢查其處理能力是否已經發揮其最佳效能。然后,對檢查的結果進行分析,如果處理能力不足,那么可以考慮更換和增加設備、系統拆分、采用并行數據庫技術、采用負載均衡技術等方式來提高服務器處理能力。
另外,通過制定一些服務器使用策略進行硬性控制,也能收到一定的效果。具體來說,可以考慮對服務器制定如下使用策略。
(1)對數據庫服務器的策略。可以考慮使用配置較高的高端服務器,強勁的處理能力,再加上高速的SAN環境,能夠滿足商業銀行對開放平臺數據庫的高吞吐量和快速響應的要求;可以采用并行數據庫技術(如Oracle的RAC)來實現高可用和性能擴展;通過統一規劃,多臺數據庫服務器使用相同的備機(即N+1備份方式),達到保證可靠性的同時降低成本。
(2)對應用服務器的策略。使用配置中等的服務器;使用負載均衡來擴展處理能力;不適合使用負載均衡的應用系統,可用分區分片的方式來擴展處理能力。
4.IT服務可持續性和可用性管理
IT服務可持續性管理就是負責預防災難、增強IT基礎架構的恢復能力和容錯能力的流程,它需要確保組織在發生災難后有足夠的技術、財務和管理資源來確保IT服務的持續性運作。
可用性是指一個組件或者一種服務在設定的某個時刻或某段時間內發揮其應有的功能的能力。它通常以可用率來表示,即在約定的服務時段內,客戶實際能夠使用的服務的時間比例。
可用性管理是有關設計、實施、監控、評價和報告IT服務的可用性,以確保持續地滿足業務可用性需求的服務管理流程。
為了確保可用性,現在商業銀行一般的措施有:定期檢查,確定重點問題;安排計劃解決重點問題。
商業銀行可以采用下面一些方法來保證IT服務的可持續性:服務器進行N+1備份;服務器進行負載均衡;服務器異地災備;使用自動化手段對數據進行備份;有完善的備份管理制度和流程等。
數據庫服務器N+1系統備份方案,是只用較少投資就能保證服務器高可用性的先進技術方案。具體來說,是在SAN環境中,假設有N臺同平臺的數據庫服務器是生產服務器,那么集中指定一臺相同平臺的備機作為所有N臺生產服務器的備份服務器,每一臺生產數據庫服務器都與備份數據庫服務器組成一個群集。當任何一臺生產數據庫服務器系統出現故障而不能對外提供服務時,安裝在服務器上的群集軟件會監控到故障的發生,并在較短的時間內由備份服務器自動或通過人工手動接管出現故障的數據庫服務器上的應用,重新對外提供業務訪問(出現故障前已有的數據庫連接會被斷開并重新與備份服務器建立連接),從而保證業務連續性。N+1備份不一定要局限在數據庫上,也可以擴展到其他同平臺的應用服務器之間,但是需要定制較為復雜的判斷和切換的腳本。
5.配置管理
配置管理是由識別和確認系統的配置額、記錄和報告配置項狀態及變更請求、檢驗配置項正確性和完整性活動等構成的服務管理流程。在配置管理中,最基本的信息單元是配置項。所有軟件、硬件和各種文檔,比如變更請求、服務、服務器、環境等都可稱為配置項。
配置管理不同于IT資產管理,后者是一個計量過程,它記錄了資產的購置時間、購買價格以及放置位置等方面的情況。而配置管理除了記錄配置項本身的情況外,還記錄了各配置項之間的關系,以及有關配置項的標準和授權方面的信息,同時它還記錄了配置項的當前狀態和變更情況。
在ITIL的框架中,配置管理是一個基礎,因此,完善配置管理對于我國商業銀行的IT管理非常重要。配置管理的發展方向是建立統一的配置管理系統,開發自動獲取配置信息的工具,結合人工輸入信息的補充,智能化地維護配置管理信息,為整個IT管理的其余內容提供堅實的基礎。
6.用戶管理
目前,各商業銀行擁有眾多的生產和辦公的開放平臺設備,其中包括多種廠商的硬件平臺及操作系統。同時,各商業銀行還擁有大量的運維和管理人員,分屬于多個部門,在不同的開放平臺系統上擁有不同特點和類型的用戶。據了解,現在商業銀行大多采用的是分散的用戶管理模式,即在各個主機上獨立維護各自的用戶。隨著系統和應用日趨復雜、人員變動不斷加快,這種管理模式使得管理員無法及時獲取用戶的變動情況,為商業銀行的日常運行管理帶來很大的麻煩,同時也存在很大的安全隱患。
因此,我國商業銀行需要考慮開展開放平臺服務器用戶集中管理。用戶集中管理具備以下優勢:跨平臺;集中管理,統一管理;用戶角色、權限的審計和設置流程;日志集中審計。
在開放平臺服務器用戶集中管理項目的系統實現后,管理員將集中管理多個系統的賬戶密碼,用戶僅需通過服務器用戶集中管理系統登錄成功后,即可登錄其他系統,大大方便了維護管理工作。在安全方面,用戶集中管理系統可以提供集中的審計日志管理,可以統一設定主賬號的名稱、密碼安全策略,以防止用戶密碼過于簡單。
7.版本管理
版本管理和補丁管理屬于ITIL管理流程中發布管理的一部分。由于操作系統、數據庫、中間件等的版本發布由各服務廠商所控制,并且和硬件體系結構也有關系,所以各商業銀行有時需更改規劃以適應服務廠商發布的新版本。
由于版本的更新一般會涉及應用的修改,而商業銀行的應用極為關注穩定性,所以在采用新版本操作系統和系統軟件方面,一般說來,商業銀行在時間上會比其他行業有所滯后。此外,由于各商業銀行均存在部分外購的應用,此類應用無相應的源代碼或者允許修改的許可證明,所以此類應用升級比較困難,從而導致不少商業銀行有同時存在多版本操作系統和系統軟件的情況。
因此,我國商業銀行在以后的發展中,需要豐富和完善版本管理規范,對于新版本,做好系統層面及應用層面的測試。此外,對于外購應用,盡量爭取到相關源代碼以及允許修改的許可證明,或者通過其他方式來避免多版本并存的問題。
8.補丁管理
補丁管理的一些情況和版本管理很類似。
在補丁管理方面,目前一般分為微軟的Windows補丁和Unix補丁兩大類。對于Windows,一般采取的策略都是盡量打上最新的補丁,以防止病毒、黑客的侵襲;而對于Unix,很多商業銀行都不太愿意經常打系統補丁。造成這種狀況的主要原因是:一方面,如果不及時打上最新的補丁,就可能面臨安全的風險;但另一方面,操作系統和系統軟件的補丁太頻繁,就難以組織全面的驗證測試,即使通過了測試,也無法保證和中間件、應用系統沒有沖突。因此,商業銀行往往難以制定統一的有效的補丁管理策略。
因此,需要盡早制定更有效的管理流程,把獲取補丁、組織測試、審批審核、補丁發布、組織試點、組織推廣實施的流程明確下來,并且對不同的補丁制定不同的測試驗證的詳細方法,這樣可以用管理的手段降低補丁管理上的風險。
9.軟件分發
在解決了版本和補丁的管理之后,接下來面臨著如何把這些軟件發布到眾多的服務器上并進行安裝的問題。
在早期環境中,由于服務器和應用數量不多,所以通過人工操作便能夠滿足要求。但現在服務器數量日益增多,而且應用、系統軟件等也不斷增多,仍然采用人工操作已經不能滿足要求。
由于開放平臺的品牌和版本較多,建立統一的、有效的軟件分發渠道較為困難,所以目前各商業銀行基本上還是采用人工安裝的方式。
10.資源監控
資源監控基本分為三類:硬件監控、系統資源和應用資源。其中,對于硬件監控,目前僅個別硬件廠商能提供監控軟件,但功能和范圍有限。所以,各商業銀行需要盡快完成各種研究,進行統一考慮,盡早實現統一監控。
針對系統資源,目前各商業銀行已經搭建起比較完善的監控平臺,能夠對目前主流的系統平臺的資源,如CPU、內存、I/O活動情況等,提供簡單有效的圖形顯示方式,并且能夠根據預定義的閾值進行報警,對主流的數據庫、中間件的各種信息,也有相當豐富的監控指標。
針對應用資源,目前各商業銀行的應用系統基本是用自行編寫的軟件進行監控,但普遍缺乏統一規劃。各商業銀行應統一規范,對其中的部分功能,應考慮和系統資源監控等現有架構結合,充分發揮現有的架構優勢。
11.存儲管理
隨著業務數據持續高速增長,存儲設備容量和規模也在快速膨脹。為適應業務發展的需求,保持高效快捷的數據處理能力,各商業銀行先后引入了基于SAN技術的集中存儲模式和理念,并進行了部署和實施。目前,集中存儲已開始在基礎架構中發揮關鍵作用,不但為開放平臺各應用系統提供了性能優越的數據訪問通道,而且以高可用的方式保證了數據存儲的安全和穩定,保障了應用系統的業務連續性。
集中存儲的一大優勢就是集中管理。當集中存儲的規模進一步擴大、存儲設備日益增多,基于存儲設備管理工具的管理方式將帶來管理效率的降低和管理成本的攀升。業界已開始關注這一問題,一些組織也發布了一些管理規范,為各種存儲設備提供統一的管理接口,消除不同存儲設備管理工具互不兼容的隔閡。
12.備份管理
備份是保證IT服務管理可持續發展的一個重要手段。備份的一個實施目標是:采用自動化、集中化的工作方式,滿足對業務數據的備份與恢復需求;實現對SAN存儲區域網的支持,對連接在SAN網絡上的各服務器進行高速數據備份及恢復;實現對SAN網上的磁帶庫、磁帶機、磁帶設備共享使用;對未連接在SAN上的服務器通過LAN實現數據備份及恢復;對業務數據進行在線備份,不影響業務正常運轉;提供與事件管理平臺的集成接口,對數據備份中出現的報警事件進行及時處理。
目前,各商業銀行的備份流程已基本規范下來,以后應著重在備份效率、虛擬帶庫等方面進行研究,對現有備份系統作合理調整,減少備份窗口,提高可恢復數據時效,降低對應用系統的影響。
13.防病毒管理
目前,各商業銀行都有較完善的防病毒管理,尤其在Windows平臺方面,基本都統一部署防病毒軟件,達到統一升級、統一殺毒和主動收集病毒報告的管理水平。而在Unix平臺方面,目前各商業銀行主要著重于安全配置。部分銀行甚至已實現郵件級別的病毒預防,并著手進行防垃圾郵件方面的技術研究。
14.安全管理
安全管理方面,商業銀行必須著眼高處。要建立安全規范與標準,這些安全規范與標準,應涵蓋主機安全、數據庫安全、開放平臺安全、網絡安全、應用安全等多方面,包括總體的安全策略、規范,同時,也要制定具體的技術標準。現在已經有些商業銀行先行一步,制定了全面的安全規范和標準。
除標準外,各商業銀行還應定期使用工具自行掃描漏洞并進行跟蹤整改,定期邀請安全公司對系統進行安全檢查,以達到更好的安全檢查效果。
對于我國商業銀行的服務器管理,由于體制、管理、技術、資金等諸多方面都不太成熟,很多比較理想的管理措施還不具備實施條件。因此,我國商業銀行應該結合自身的特點,對照ITIL框架體系,做好近期的規劃,加強服務器管理。一些技術成熟、成效大的措施可以盡快推廣,如并行數據庫、負載均衡、N+1備份、資源監控、用戶集中管理等。從長遠來說,只有建立完善的成本核算和服務等級管理體制,才能真正建立一套符合ITIL標準的、科學的服務器管理體系。