據不完全統計,國產大模型數量目前已超過200個,覆蓋多個行業領域,應用場景不斷拓展。國家互聯網信息辦公室最新公布的數據顯示,截至今年3月,我國共有117個生成式人工智能服務完成備案。
目前,我國大模型數量不斷增加,且應用不斷加速,這需要海量智算的支撐。受需求影響,我國智算規模持續擴大,據中國信通院,截至2023年底,我國算力規模達到230EFLOPS,其中智能計算占比近30%,規模約69 EFLOPS,相較于2023年6月的50EFLOPS,半年時間規模增加38%。
伴隨智算的快速發展,數據中心也從主要提供通用算力轉向提供智算,數據中心向智算中心演進。對企業而言,這意味著巨大的產業機遇,但同時,也有著實際的挑戰需要面對。
一是數據中心提供智算并非簡單用GPU服務器替換原有服務器,從基礎設施上來看,供電、散熱、樓層承重等都有可能因此改變,需要進行一系列的優化;一是市場競爭越發激烈,智算中心規模正快速增加,據中國IDC圈不完全統計,截止2024年5月23日,中國大陸已有智算中心283座,目前超過一半(53%,150座)智算中心都處于開工/在建狀態(點擊了解《283座智算中心的區域分布和規模詳情》)。在高漲的智算需求下,可以預見,未來還將建設更多智算中心,如何受到市場認可,提升上架率等問題也擺在企業面前。
智算中心項目整體建設進展
具體來看,數據中心向智算中心演進,其基本的區別在于智算中心搭載的主要是GPU,服務對象主要是人工智能應用,而GPU的功率較高,這就需要適配一整套軟硬件設施。
如供配電方面,高功率設備需要更大的電流和更高的電壓來保證其正常運行,這就要求供配電系統具備足夠的容量和穩定性,可能需要優化原有設備。
散熱方面,高功率對于制冷提出了更高的要求,傳統風冷有其散熱極限,制冷更高效率的液冷被公認為是智算標配,據《中國液冷數據中心市場深度研究報告》,單機柜密度<20KW,采用風冷可滿足散熱需求;單機柜密度≥20KW便需要采用液冷技術。
運維方面,液冷的應用及供配電等方面的改變會對運維造成較大影響,如液冷與風冷運維方式有較大差異,需要專業人才的檢查維護。
除此之外,大量數據的傳輸、存儲,還需要高效傳輸網絡、先進存儲的支撐,同樣也需要進行在硬件上進行革新,以提升網絡帶寬、提高存儲效率。硬件的應用也不能孤立進行,所有的硬件革新均需要軟件層面的適配,以實現更高效的資源利用,提升整體性能。
數據中心向智算中心演進,需要綠色安全、普惠易用,這樣才能在符合政策要求下,提升市場競爭力。
綠色方面,數據中心是高能耗產業,“雙碳”目標下,綠色化是數據中心發展的必然趨勢,能耗效率不過關的數據中心正逐步改建、騰退,在數據中心向智算中心演進的過程中,節能低碳將實現進一步發展。
國家也正通過“東數西算”工程等來加快綠色發展,各地方也在限定PUE等一系列舉措來推進,以北京市2023年12月發布的地方標準《數據中心能源效率限額》為例,相較于2019年第一次修訂后的標準,PUE限定值從1.4降為1.35.先進值從1.2降為1.15.準入值不僅從原來的1.3有所降低,還更為細化,年能耗≤2萬噸標煤的PUE準入值為1.25.年能耗>2萬噸標煤的PUE準入值為1.2.
由此可見,只有綠色低碳的智算中心才符合政策標準,實現可持續發展。從行業來看,提升綠電使用比例、促進儲能發展,提升液冷應用等,均是推動智算中心綠色化的重要舉措,目前也已經在被逐步應用。
安全方面,智算中心是指通過使用大規模異構算力資源,包括通用算力和智能算力,主要為人工智能應用提供所需算力、數據和算法的設施。
在提供算力、數據、算法的過程中存在數據、網絡與設備安全隱患等問題,需要加強通信網絡安全防護管理,提升網絡安全防護能力水平,創新數據中心災備建設,加強網絡穩定性監測,確保數據傳輸安全,建立健全算力網安全風險研判、防控協同、防范化解機制等
普惠易用方面,即智算成本低廉,且便于用戶使用,這是獲得更大市場的必要條件。
目前來看,想要實現這一點,需要從多方面入手,從企業自身出發,可以通過應用液冷技術、優化建設布局,運用智能運維等提升算力有效供給。如在用電成本較低的地區建設智算中心。用電占據著數據中心運營過程中的主要成本,智算中心同樣如此,如果用電投入減少,算力成本也就降低,能投推動算力的應用,提升上架率。從地理位置上來看,我國西部地區在電價上有較大優勢,伴隨著“東數西算”工程的啟動與深入,西部樞紐智算中心建設正在加快,目前項目數量已達到56個(點擊了解《283座智算中心的區域分布和規模詳情》),將有效推動智算成本的降低。
圖:智算中心東西部地域投資額和算力規模
從行業出發,算力調度的優化、算力券的發布等都是降低智算成本的有效舉措,而這需要多主體共同協作,包括政府部門、算力服務方、算力調度方、算力用戶等,這能夠積極促進智算消納,形成良好的供需關系,提升智算中心的上架率,實現智算的即需即取。
綜合來看,大模型等人工智能快速發展下,數據中心加速向智算中心演進,這其中有著巨大的機遇,但也有著諸多挑戰,企業想要從中獲益,需要清晰的了解數據中心與智算中心的區別,明確如何進行優化革新,同時還要積極響應政策,推動智算中心的綠色安全、普惠易用,以提升自身競爭力,推動智算的有效供給。