前言 :
目前主流的服務(wù)器外形從架構(gòu)上來說無非就是塔式和機(jī)架兩種。塔式服務(wù)器專為需要卓越性能的企業(yè)精心設(shè)計,塔式服務(wù)器充足的空間可以安裝更多的CPU、內(nèi)存,可以安裝各種全高的擴(kuò)張卡、存儲陣列所用的大量硬盤,以及配備更多的冗余單元。而機(jī)架式服務(wù)器則占據(jù)更小的空間,使用標(biāo)準(zhǔn)的機(jī)架外形,單位體積內(nèi)可以提高更多的計算能力,從而降低了成本。因為主機(jī)托管費用根據(jù)體積來計算的,托管塔式服務(wù)器非常昂貴,所以選擇一款機(jī)架式服務(wù)器是非常必要的。對于企業(yè)內(nèi)服務(wù)器,使用塔式則可以取得更好的性能。
498)this.style.width=498;" border=0>
機(jī)架式服務(wù)器也有多種規(guī)格,例如1U(高4.45cm)、2U、4U、6U、8U等。通常1U的機(jī)架式服務(wù)器最節(jié)省空間,但性能和可擴(kuò)展性較差,適合一些業(yè)務(wù)相對固定的使用領(lǐng)域。服務(wù)器通常用于托管,因此選擇信息服務(wù)企業(yè)(如ISP/ICP/ISV/IDC)就顯得尤為重要,特別是機(jī)房是否具備嚴(yán)密的保安措施、良好的冷卻系統(tǒng)、多重備份的供電系統(tǒng)等成為了考量一個機(jī)房優(yōu)越的重要標(biāo)準(zhǔn);但是帶寬則算是所有資源里最重要的一項。
498)this.style.width=498;">
價格僅供參考
由于中國電信擁有了絕大部分的帶寬,將服務(wù)器托管在電信的機(jī)房當(dāng)然是首選。但電信機(jī)房的承重壓力也使得其“門檻”愈來愈高,不是簡單托管費可以解決。
據(jù)了解,由于廣州本地電信的機(jī)房托管的機(jī)器數(shù)目不斷增加,供電負(fù)載已經(jīng)不能滿足服務(wù)器數(shù)目的需求,服務(wù)器用電和機(jī)房散熱用電產(chǎn)生沖突。在還沒擴(kuò)建好更強(qiáng)供電系統(tǒng)前,電信機(jī)房方面從功耗方面下手,對托管的機(jī)器開機(jī)運行的時候都進(jìn)行功耗的測試,對于電流需求大于0.8A即功率大于180W左右的服務(wù)器拒絕供托管服務(wù)。
498)this.style.width=498;" border=0>
以單核心的處理器為例,AMD的Opteron以及Intel的Xeon目前單個處理器的滿載功耗已經(jīng)接近100w,而AMD由于內(nèi)核的設(shè)計優(yōu)勢,其滿載功耗相對會低一點。若一個2U的服務(wù)器,兩個處理器加上硬盤以及其他散熱系統(tǒng),180W這個門檻實在太高,很多的機(jī)器功耗都大大高于該要求。我們今天就利用相關(guān)的測試儀器對Intel跟AMD的2U服務(wù)器平臺進(jìn)行一次詳細(xì)的功耗測試對比。在本次的測試中,我們會利用專用的儀器配合有負(fù)載功率顯示的電源進(jìn)行測試,確保測試數(shù)據(jù)的準(zhǔn)確性。我們選用了兩款價格定位完全一樣,并且其實際的效能也相對接近的機(jī)型進(jìn)行測試。
致榮 ZR Power D7C :
498)this.style.width=498;" border=0>
在這次測試中,我們采用了國內(nèi)著名的服務(wù)器供應(yīng)商致榮所提供的設(shè)備來完成我們這次的測試。Intel的平臺方面,我們采用的是致榮 Power D7C的2U服務(wù)器,服務(wù)器的面板提供了6個可熱插拔SCSI硬盤托架,有面板的右側(cè)則為CDROM以及軟驅(qū)設(shè)備。
致榮 Power D7C | |
CPU |
Intel Xeon Nocona 2.8G 2m Cache x2 |
主板 |
Intel E7520BD2S |
內(nèi)存 |
Infineon PC3200 ECC Registered 1G x2 |
硬盤 |
Maxtor ATLAS 10K V 73G x1 |
軟驅(qū) |
Floppy 1.44m x1 |
光驅(qū) |
24x CDROM x1 |
顯卡 |
Integrated ATI RAGE XL SVGA PCI video controller |
網(wǎng)卡 |
Integrated Intel 82541PI Gigabit Ethernet Controller Integrated Marvell Yukon EC88E8050 PCI-Express Gigabit Ethernet Controller |
其他 |
Integrated Silicon Image SI3114 SATA RAID Controller |
電源 |
510watt(MAX) Power Switch x1 |
首先來看看這款機(jī)器的具體配置,這款機(jī)型采用了Intel支持64位功能的Nocona核心Xeon處理器,新核心的Nocona Xeon處理器采用90納米制程技術(shù)制作,前端總線提高至800MHz,二級緩存升級為2m,它整合Demand Based Switching (DBS)技術(shù),使得處理器能做到在空閑時自動降低處理器的倍頻、前端總線頻率和電壓,來達(dá)到節(jié)能和降低發(fā)熱量的目的,但需要主板的配合才能支持該功能。 Nocona具備Intel Extended Memory 64技術(shù)(,提供64位的內(nèi)存尋址能力,讓用戶體驗64位的運算能力,同時又能高效率地執(zhí)行現(xiàn)今市面上所有的32位應(yīng)用程序,帶來更高的應(yīng)用程序彈性。此外,英特爾超線程技術(shù)的改良能提升多重線程程序的性能,而Streaming SIMD Extensions 3指令集則針對媒體與游戲等應(yīng)用改進(jìn)線程的同步運作效率,提高系統(tǒng)的響應(yīng)速度。
498)this.style.width=498;" border=0>
此外,和老至強(qiáng)一樣,Nocona也支持Hyper-Threading技術(shù)。超線程技術(shù)通過在處理器上復(fù)制體系結(jié)構(gòu)狀態(tài),同時共享一組處理器的執(zhí)行資源,可實現(xiàn)線程級并行處理。因為通常的CPU的執(zhí)行單元并不是任何時候都100%滿負(fù)荷運轉(zhuǎn)的,總有一些資源處于空閑狀態(tài),Hyper- Threading的本質(zhì)就是提高CPU執(zhí)行單元的利用效率,并將其轉(zhuǎn)換為實際運算能力的提高。超線程技術(shù)增強(qiáng)設(shè)計用于改進(jìn)多線程應(yīng)用的性能,同時擴(kuò)展的 SIMD流指令擴(kuò)展3能夠顯著改進(jìn)線程同步性能,從而可為諸如媒體和游戲等應(yīng)用帶來出色的系統(tǒng)響應(yīng)能力。Nocona同時支持2個CPU SMP對稱多處理,在系統(tǒng)內(nèi)最多可以模擬出4個處理器。若還需要更多的處理能力,則需要使用更加昂貴的Nocona MP,可以實現(xiàn)4路或者更多路的SMP。
498)this.style.width=498;" border=0>
我們從硬件上的額定功率粗略地統(tǒng)計一下整機(jī)的功耗水平。由于兩顆處理器的發(fā)熱并不少,加上機(jī)房的散熱條件比較惡劣,因此機(jī)箱內(nèi)部的散熱系統(tǒng)并不可馬虎了事,這款機(jī)型配備了4把電流為0.66A的機(jī)箱風(fēng)扇,也就是這把風(fēng)扇加起來的峰值功率已經(jīng)達(dá)到31W左右,而處理器的兩個散熱風(fēng)扇電流為0.78A,因此這兩個風(fēng)扇的峰值功率18W左右,由于CPU的散熱器支持溫控功能,因此其實際的功耗會相對低一點。單個Xeon處理器滿載時候的峰值功率約為85W左右,而兩個加起來則約為170W。而單個的萬轉(zhuǎn)SCSI硬盤加上熱插拔模塊的功率約為20W左右。Intel的服務(wù)器主板功耗約為30W左右。兩條容量為 1G的DDR400內(nèi)存功耗約為20W。軟驅(qū)加上CDROM驅(qū)動器的功耗約為15W左右。統(tǒng)計起來,整機(jī)的峰值理論功耗達(dá)到了304W,遠(yuǎn)遠(yuǎn)超出了電信機(jī)房所限制的180W水平。
致榮 ZR Power K8222D :
498)this.style.width=498;" border=0>
再來看看AMD的平臺,我們采用的是致榮的型號為Power K8222D的2U服務(wù)器,服務(wù)器的面板結(jié)構(gòu)和Intel的D7C較為類似,同樣提供了6個可熱插拔SCSI硬盤托架,有面板的右側(cè)則為CDROM以及軟驅(qū)設(shè)備。
致榮 Power II K8 | |
CPU |
AMD Opteron 242 SledgeHammer 1m Cache x2 |
主板 |
TYAN Thunder K8S Pro (S2880) |
內(nèi)存 |
Infineon PC3200 ECC Registered 1G x2 |
硬盤 |
Maxtor ATLAS 10K V 73G x1 |
軟驅(qū) |
Floppy 1.44m x1 |
光驅(qū) |
24x CDROM x1 |
顯卡 |
Integrated ATI RAGE XL SVGA PCI video controller |
網(wǎng)卡 |
Integrated Broadcom BCM5704C dual-channel GbE LAN |
其他 |
Integrated Promise PDC20378 SATA/SATA RAID |
電源 |
510watt(MAX) Power Switch x1 |
這臺致榮的Power K8222D 2U服務(wù)器采用的為AMD Opteron 242處理器,該處理器的核心代號為SledgeHammer,該核心相比起目前Athlon64的制作工藝相對落后一點,仍然采用0.13微米的工藝制作,二級緩存的容量為1m。其發(fā)熱量相比起先前幾款Opteron略小,這就允許CPU能夠搭配較為便宜的鋁制散熱器,而先前的幾款Opteron處理器必須使用厚厚的銅底座散熱器才能穩(wěn)定工作,與此對照的是Intel Xeon處理器必須使用的純銅制散熱片加上大功率的風(fēng)扇才能控制其較大的發(fā)熱,這也從另外一方面反映出Intel相比起AMD的功耗要大一點。
498)this.style.width=498;" border=0>
AMD強(qiáng)調(diào)TPI(True Performance Initiative)有助于用戶注重系統(tǒng)的整體性能,而不再僅僅把CPU的時鐘速度作為衡量計算機(jī)性能的唯一標(biāo)準(zhǔn),因此AMD的處理器實際頻率相比起 Intel的要低得多,而實際得效能表現(xiàn)卻并不落后。每塊Opteron處理器都具有屬于自己的內(nèi)存控制器,都可以管理自己的內(nèi)存bank,這意味著多塊 CPU不用再為爭奪前斷總線或內(nèi)存容量而苦苦爭斗,也就是說, Opteron 系統(tǒng)的可伸縮性非常大。在多Opteron 處理器系統(tǒng)中,由于每塊CPU擁有自己的內(nèi)存帶寬,從理論上說,兩塊CPU將擁有兩倍的內(nèi)存帶寬(10.6 GB/s),四塊CPU將擁有四倍的內(nèi)存帶寬(21.3 GB/s),依次類推。
498)this.style.width=498;" border=0>
我們再來從硬件上的額定功率粗略地統(tǒng)計一下整機(jī)的功耗水平。該箱體得內(nèi)部結(jié)構(gòu)與我們剛才接受的Intel平臺較為類似,機(jī)箱內(nèi)部的散熱系統(tǒng)同樣配備了4 把電流為0.66A的機(jī)箱風(fēng)扇,也就是這把風(fēng)扇加起來的峰值功率已經(jīng)達(dá)到31W左右,而處理器的兩個散熱風(fēng)扇電流為0.68A,因此這兩個風(fēng)扇的峰值功率 16W左右,由Opteron的處理器發(fā)熱較少,因此其對散熱風(fēng)扇的要求也低一點。單個Opteron處理器滿載時候的峰值功率約為80W左右,而兩個加起來則約為160W。而單個的萬轉(zhuǎn)SCSI硬盤加上熱插拔模塊的功率約為20W左右。TYAN的服務(wù)器主板功耗約為30W左右。兩條容量為1G的 DDR400內(nèi)存功耗約為20W。軟驅(qū)加上CDROM驅(qū)動器的功耗約為15W左右。統(tǒng)計起來,整機(jī)的峰值理論功耗達(dá)到了292W,同樣也是遠(yuǎn)遠(yuǎn)超出了電信機(jī)房所限制的180W水平。關(guān)于這兩款機(jī)器的實際功耗表現(xiàn),我們接下來會做更為詳細(xì)的測試。
測試說明 :
498)this.style.width=498;" border=0>
我們采用了AcBel 550W的電源代替機(jī)器原配的電源進(jìn)行測試,主要是由于AcBel的這款電源提供了可視化的LCD面板,該面板采用數(shù)字化設(shè)計,玩家可通過液晶顯示屏讀取電源供應(yīng)器里的各項數(shù)據(jù),當(dāng)然包括了我們最主要的功耗數(shù)值讀取了。而由于電源內(nèi)部的散熱風(fēng)扇以及面板也需要電力的支持,我們把電源內(nèi)部風(fēng)扇的轉(zhuǎn)速調(diào)至最低的水平,這部分的功耗約為5W左右,因此測試的數(shù)據(jù)約有5W左右的誤差。
498)this.style.width=498;">
Intel雙Xeon運行4個SuperPI時滿載的截圖
498)this.style.width=498;" border=0>
498)this.style.width=498;">
AMD雙Opteron運行4個SuperPI時滿載的截圖
除此之外,我們也采用了另外一種方式對服務(wù)器的功耗進(jìn)行檢測。我們利用上圖的交直流鉗型測試表直接對連接電源插座與主機(jī)電源的導(dǎo)線電流進(jìn)行測試,該測試儀器實際上就是一個電流表,對單根導(dǎo)線內(nèi)通過的電流進(jìn)行量度,如上圖所示,量度出來的數(shù)據(jù)為0.85A安培,也就是說此時電源消耗的功率為 220V*0.85A=187W。
測試數(shù)據(jù)列表 :
測試平臺 比較 |
Power D7C Intel Xeon |
Power K8222D AMD Opteron | ||||||
測試狀態(tài) |
風(fēng)扇全開 |
關(guān)閉機(jī)箱風(fēng)扇 |
風(fēng)扇全開 |
關(guān)閉機(jī)箱風(fēng)扇 | ||||
測試方式 |
電流表 |
電源 |
電流表 |
電源 |
電流表 |
電源 |
電流表 |
電源 |
開機(jī)狀態(tài) |
1.02A |
218W |
0.83A |
194W |
0.94A |
208W |
0.89A |
197W |
系統(tǒng)空閑 狀態(tài) |
0.77A |
182W |
0.68A |
158W |
0.91A |
192W |
0.78A |
168W |
文件復(fù)制 狀態(tài) |
0.81A |
194W |
0.76A |
170W |
0.94A |
204W |
0.84A |
180W |
CPU滿載 狀態(tài) |
1.20A |
254W |
1.05A |
230W |
1.06A |
216W |
0.94A |
192W |
整機(jī)滿載 狀態(tài) |
1.25A |
266W |
1.13A |
242W |
1.09A |
218W |
0.96A |
197W |
而由于兩款機(jī)型的散熱系統(tǒng)所耗費的功率甚大,4把機(jī)箱風(fēng)扇理論的峰值達(dá)到了31W,因此我們在功率測試中會劃分為兩部份比較,分別是風(fēng)扇全開以及關(guān)閉機(jī)箱風(fēng)扇兩組數(shù)據(jù)。而在測試中,我們會對機(jī)器的5種情況進(jìn)行功耗的測試,分別為開機(jī)狀態(tài)、進(jìn)入系統(tǒng)后空閑的狀態(tài)、在系統(tǒng)中僅進(jìn)行文件的復(fù)制狀態(tài)、在系統(tǒng)中模擬CPU滿載的狀態(tài)以及模擬整機(jī)滿載的狀態(tài)。在開機(jī)的一瞬間,對電源要求的功耗是最大的,因此這也是我們的測試對比重點;而在系統(tǒng)空閑的狀態(tài)下,我們可以比較一下?lián)碛蠨BS動態(tài)節(jié)電技術(shù)的Xeon處理器相比起這款由于主板不能提供支持而不能實現(xiàn)Power Now技術(shù)的Opteron有何優(yōu)越性;在系統(tǒng)進(jìn)行單一的文件復(fù)制,也就是模擬服務(wù)器最頻繁的動作,對數(shù)據(jù)的讀取與寫入時功耗的比較;而模擬CPU滿載,我們利用到4個SuperPI進(jìn)行運算;而整機(jī)滿載的模擬,我們通過4個SuperPI加上文件的復(fù)制與寫入進(jìn)行測試。
從測試數(shù)據(jù)我們可以了解到,在開機(jī)狀態(tài)、進(jìn)入系統(tǒng)后空閑的狀態(tài)以及在系統(tǒng)中僅進(jìn)行文件的復(fù)制狀態(tài)中,Intel的Xeon平臺功耗都有著一定的優(yōu)勢,功耗相比起AMD的Opteron要少5~10W左右。實際上主要是由于在這三個狀態(tài)之下對CPU的占用率都幾乎等于零,而Intel Nocona核心的Xeon所擁有的Demand Based Switching (DBS)技術(shù)的功效也因此而體現(xiàn)出來,DBS技術(shù)可以根據(jù)CPU的實際使用情況有效地減少CPU的功耗以及發(fā)熱。而這款Opteron 242處理器由于主板無法提供Power Now技術(shù)的支持,因此我們也無法開啟AMD的Power Now節(jié)電技術(shù),因此在這部分AMD的Opteron 242功耗明顯較大。
498)this.style.width=498;" border=0>
能源利用率,誰壓著誰?
而在系統(tǒng)中模擬CPU滿載的狀態(tài)以及模擬整機(jī)滿載的狀態(tài)下,也體現(xiàn)出了Nocona核心的Xeon處理器缺點,當(dāng)處理器全速運行之后,其功耗以及因而帶來的發(fā)熱問題十分嚴(yán)重,由于Nocona核心與桌面平臺Prescott核心的Pentium4處理器架構(gòu)十分類似,只是Prescott的核心被屏蔽掉某些功能而已。在我們熟悉的桌面平臺上,Prescott核心的Pentium4處理器由于發(fā)熱以及功耗的問題也因此而走到了盡頭,而回到服務(wù)器領(lǐng)域上同樣采用NetBurst架構(gòu)的Nocona核心Xeon也存在同樣的問題。較高的工作頻率并沒有為Intel帶來更多的性能優(yōu)勢,其性能與我們這次對比的 Opteron 242好不到哪里,而從測試的數(shù)據(jù)我們可以了解到,AMD Opteron平臺的功耗要比效能相仿的Intel Xeon平臺低40~50W左右,發(fā)熱也相對地減少很多。
在目前的服務(wù)器市場上,AMD的Opteron處理器與Intel的Xeon 之間的競爭已經(jīng)轉(zhuǎn)移到雙核心的架構(gòu)之上。雙核心的處理器可以用于1到8路服務(wù)器和1到4路工作站解決方案。適于采用這款處理器的行業(yè)有跨國企業(yè),中小企業(yè),以及政府/教育機(jī)構(gòu);希望提高數(shù)據(jù)庫處理事務(wù)的速度,或者通過電子商務(wù)式應(yīng)用支持更多用戶的企業(yè);需要迅速的圖形響應(yīng)(例如CAD和DCC)的客戶;需要為金融建模和科學(xué)應(yīng)用執(zhí)行大運算量任務(wù)的行業(yè)等。作為一個服務(wù)器方案,雙核心的處理器通過內(nèi)部的調(diào)整其性能也得到了接近兩倍的提升。換個角度說,就是一臺服務(wù)器使用兩個雙核的處理器則可以對抗4路的服務(wù)器,當(dāng)然實際上也會有一點的性能損失,但其性能已經(jīng)是十分接近。AMD在Intel的雙核心Xeon 到來半年前向服務(wù)器市場推出了雙核心Opteron處理器,同時AMD憑借其處理器的性價比,無遺會為其帶來更多的客戶。無論怎樣,可以看到AMD跟 Intel未來的雙核處理器發(fā)展計劃中對功耗的控制都十分注重,在性能提升的情況下,處理器的功耗卻有所降低,尤其是Intel方面,采用了全新的架構(gòu)設(shè)計的處理器,其性能也是值得我們期待的。