成立于1963年的東安格利亞大學(University of East Anglia,UEA)位于諾里奇(Norwich),是英國老牌重點大學,也是世界公認的擁有一流研究水平的大學。高質量的教學與高水平的研究為東安格利亞大學帶來了極高的國內和國際學術聲譽,該校近90%的研究成果被認定為具有“國際卓越”水平,在最新的研究成果評審中超過50%的研究成果被列為“世界領先”。在環境科學研究方面,東安格利亞大學一直處于世界領先地位,2007年,該校20多名環境研究科學家因在環境科學研究領域的杰出成就與美國前副總統戈爾共同獲得了諾貝爾和平獎。
HPC應用需要拓展
作為一所注重研究的大學,高性能計算平臺對確保UEA各項研究的順利進行至關重要。在過去十多年中,高性能計算(HPC)一直是UEA的重要組成部分,專用的HPC系統支撐著氣候和環境研究以及化學、計算機科學和數學學科研究。但隨著研究需求的不斷增長,UEA對計算能力的需求也在增長,原有HPC系統已經不能滿足研究工作的需求。搭建綠色HPC平臺不僅對經常使用數據中心處理研究數據的氣候研究人員,而且對UEA來說都是非常重要的,因此,UEA開始尋找方便用戶使用、合適的HPC解決方案,一方面拓展HPC的應用范圍,支撐跨學科的藝術和人文科學等研究;另一方面能以有效的方式增加計算能力,使之可以根據任務調度自動控制開啟和關閉系統,在讓HPC系統更快、更易于管理、提供的功能更強大的同時,滿足減少碳排放和降低功耗的嚴格要求。
為了建立綠色HPC中心,UEA經過仔細比較,選擇了與系統集成商Viglen合作,并采用Platform HPC解決方案。
“我們希望能找到比Sun Grid Engine和Cluster Vision解決方案更加智能和擁有更多特點的解決方案。Platform HPC解決方案在提供了先進的集群管理和調度功能的同時,降低了IT部門的管理負擔,讓管理員能在用戶需要時第一時間協助他們解決問題。”UEA計算機專家兼UEA氣候研究所(CRU)所長Collins先生說。
讓新的HPC能為更多的學科研究提供支撐也是UEA選用Platform HPC解決方案的一個重要原因。Viglen HPC產品經理David Power說:“需要用到HPC資源的用戶形形色色,應用也多種多樣,這就要求新的HPC解決方案能支持各種不同的應用。Platform HPC解決方案允許多個操作系統在同一時間在同一個集群上運行,從而拓展了HPC應用范圍,用戶群超越了傳統的HPC學科,整個大學的用戶都能受用。”
Platform HPC解決方案易于使用的Web界面是UEA決定采用Platform HPC解決方案的另一個重要因素。“易于使用的Web界面為用戶帶來了巨大的好處,如果非HPC用戶需要使用該系統,他們可以通過Web界面來使用,而無需使用命令行接口。”Collins說。“利用Platform HPC解決方案,我們不必化費太大的力氣或者做大量的編程工作,就能發布一個新的應用。”
Viglen的CEO BordanTkachuk先生說:“Viglen非常重視計算中心的綠色節能,特別是在傳統的高計算能力和高功耗的HPC領域。UEA成功部署Platform HPC解決方案說明,利用領先的HPC技術,可以在保證充足的計算能力的同時,降低能耗。”
BordanTkachuk先生進一步補充說:“UEA需要一個更快、更容易管理、擁有更多能力的管理系統。計算能力的增加使UEA進行研究時可以跨更大的數據集,并可以在比以前更細的粒度級別進行研究。UEA新的HPC平臺是卓越的高性能研究平臺,可以滿足UEA世界領先級研究的需要。”
計算能力翻番
UEA新的HPC平臺擁有2032內核和168個計算節點。UEA也在集群上增加了GPU節點以增加處理能力。新HPC系統投入使用后,短短幾個月的內,就為UEA增加了一倍多的計算能力,從9萬億次浮點的運算能力增至21.5萬億次浮點,計算能力顯著增加。
數據中心是UEA電力消耗最大的部門,如今,Platform HPC解決方案正在幫助UEA減少碳排放和降低能耗,從而節省資金。“這在很大程度上得益于可根據需要量和使用量自動開啟和關閉電源系統。實施Platform HPC之前,UEA無法優化能耗,因為即使沒有運行工作負載,系統仍然消耗能源。現在,UEA可以關閉不使用的節點,顯著減少能源浪費和成本。” Collins說。
遷移更簡單、安全。“我們需要不斷地將新用戶遷移到HPC平臺上。遷移和鏈接應用是繁瑣的過程。在此之前,我們必須區分哪些節點的應用是可以運行的。采用Platform HPC解決方案后,利用Platform MPI,我們可以在Ethernet和Infiniband上為應用提出請求,并輕松地將它鏈接到Platform MPI。” Collins說。
Platform HPC解決方案提供的豐富的管理功能讓Collins和他的團隊受益匪淺。“借助Platform HPC,主節點能感知作業隊列的資源需求量和每個節點的進程,及時關閉暫時不需要的節點。當資源使用量增加時,主節點可以在一兩分鐘內開啟相應的節點以滿足需求。“Collins說。
Platform HPC還帶來了以下好處:
•根據特定任務對硬件的需求,智能地分配工作負載,幫助UEA提高計算資源的使用率;
•更有效地使用軟件許可,最大限度地提高吞吐量,并利用Platform HPC降低管理難度;
•通過Platform MPI簡化對并行作業的管理。
Collins對Platform HPC解決方案非常滿意。UEA目前正計劃購買更多的Platform HPC軟件許可,爭取在未來一年內將系統的規模再次翻番,從而讓整個UEA都能利用HPC環境進行高性能計算,繼續保持其世界領先的研究水平。