能夠在云環境中獲得高性能嗎?答案是肯定的。
過去,高性能計算(HPC)并不需要云資源。IT部門經常根據摩爾定律來預測處理器速度的快速提升,但如今摩爾定律已陷入停滯,導致單核(單線程)的速度在3GHz左右徘徊。顯然,僅靠通過增添計算資源來提高計算能力已經不可行了。在這種情況下,需要高性能計算的機構必須購置額外的物理基礎架構或找到一條通向云計算的可行之路。
IT預算短缺以及數據中心面臨的電力和冷卻等問題促使企業必須合理地規劃資源的使用。通過額外購買物理基礎架構雖然能滿足峰值工作負載,但可能會造成非峰值期資產的閑置不用,因為高性能計算工作負載具有突發性,即大型項目在短時間內需要很多計算資源。如果企業并不想為峰值工作負載構建系統,其結果又可能不能隨時有充足的計算資源可用。
精心設計的高性能計算環境可以充分利用云基礎架構,并獲得高性能、高利用率以及動態擴展集群規模以處理峰值工作負載的能力。一些高性能計算企業云計算實踐結果有力地證明了HPC云應用既在技術上切實可行,又能帶來經濟效益,是可以實現既定目標的。
Platform提供的一系列強大而靈活的HPC云解決方案,使用戶可以通過配置HPC數據中心,來滿足云風暴的需求。Platform可以幫助用戶提高在云基礎設施中運行的HPC應用程序的利用率。Platform提供的工具包括提供動態主機功能的Platform LSF、Platform MultiCluster協調工具和用于基礎設施共享的Platform ISF,為創建滿足高性能計算應用程序需求的云環境提供方便。
工作負載調度。使用云環境下的Platform LSF動態主機功能,云資源在運行時就像是擁有本地IP地址和主機名稱的現場HPC數據中心。任務提交后,內置在軟件中的Platform LSF守護程序可讓云資源識別映像請求,并通過添加有效映像來準備好處理工作負載的資源。發送到云的工作負載可進行完善,只要允許用戶標記某任務,確保應用程序、數據和云資源經配置后,就可在云中運行。
多集群管理。使用結合Platform LSF的Platform MultiCluster協調工具解決方案,用戶就能開始與任何云或主機托管提供商一起建立新的集群,而不需要專用鏈路。云集群變得可用,用戶可以使用MultiCluster來處理工作負載在內部HPC集群與基于云的外部集群資源之間的分配。當然,還必須考慮安全、監管、服務級別協議/服務級別目標(SLA/SLO)等因素驅動。
云管理。Platform ISF擁有處理多種不同類型系統的資源工具包,其中包括物理或虛擬系統;Linux/Unix/Windows系統;VMware、XEN、Hyper-V和KVM等虛擬機;亞馬遜和Rackspace等云資源。
通過結合使用Platform ISF和Platform LSF,用戶能夠自動向上或向下擴展集群。Platform ISF可以管理物理資源和虛擬化資源,同時還能向外擴展到其他服務器——或者擴展到企業內部的基礎設施,或者擴展到企業外部的云托管提供商、云計算公司或其他類型的服務提供商。物理資源還可以根據需要,自動重新配置,以滿足應用程序的需要,比如操作系統的特定要求。
此外,Platform ISF具有政策管理功能,可用于專門針對處理任務、滿足服務級別協議(SLA)所要求的虛擬資源類型,為不同的應用程序量身制定政策;可以根據應用程序動態向企業內部擴展、向企業外部的云環境擴展,也可不擴展而用于獨立定義工作。