用何種測量指標和測量方式取決于使用它們的用戶。例如,制造商和軟件研發者與賣方和市場部門有不同的需求和關注領域。IT組織可能需要在宏觀或全局上關注數據的成本、能源使用量、服務器的數量或類型、存儲器容量或支持的事務數量等。測量指標還需要隨時間而變化,包括在開發過程中對生產和質量的保證、銷售和市場營銷、客戶的需求和安裝、集成測試和后續的支持。
指標包括性能、可用性、容量和能源消耗以及一般的健康狀況和使用狀態,還包括建立一個解決方案的可行性。對于各種使用場合,度量指標可以解決何時使用IT資源來處理工作或移動數據以及數據不使用時如何存儲數據的問題。從PCFE的觀點來看,監測IT資源需要與有效工作結合,存儲的數據量的測量要結合指定碳排放量和指定服務與費用等級。
圖5.3左側顯示了不同側重的測量指標,從處于底端的設施到頂端的商業和應用程序。如圖5.3右側所示,各種測量方式和指標可以滿足不同類別的資源管理基礎設施(IRM旬的監測、通知、記錄、報告以及相關和分析工具的需求。
從PCFE的觀點來看,對能源消耗、費用、散熱量、二氧化碳排放量的測量指標應該被制定得靈活有效。IT資源必須對許多因素加以衡量和考慮,包括活動期或非活動期、環境、應用程序、計算或I/O中心、正在被存儲的數據量(樣儲中心)與正在被處理的數據量和地理位置(它決定能源效率,可用性和排放量
以服務器為中心的環境,可以便用電力能源、冷卻服務器與存儲器以及其他IT設備進行比較。在一個存儲容量和I/O操作占較大比例、卻有較少的計算量和服務器資源的環境下,服務器可能會表現出較低的服務器性能和較高的存儲器(如磁盤和磁帶)的性能。記住,這些反映的都是平均情況,典型的環境和"實際里程將有所不同"都取決于具體情況。
建立一套測量基準很重要,也是出于多方考慮的。它包括建立正常和異常行為標準、確定使用方式和性能模式的趨勢以及預測和規劃的目的。例如在知道了典型的I0P(輸入/輸出速率)和存儲設備的吞吐率以及常見的錯誤率、平均隊列深度和響應時間后,問題產生或發生變化時,就可以快速做出比較和決策。
測量基準的建立應立足于資源性能和響應時間、容量和空間利用率、可用性和能源消耗量。測量基準也應由不同的應用程序工作方案而確定,以便了解如某些任務正常狀況下需要多久完成。測量基準的IRM功能,包括數據庫的維護、備份、病毒檢查以及安全掃描,可用于對執行任務時間過長或完成任務過快等情況進行監視,因為以上這兩種情況都可能表明出現了問題。另一個例子是相對正常時的過高和過低的CPU利用率,可能表明因一個應用程序或設備錯誤而導致CPU過度工作或對正進行工作的阻礙。
為達到規劃的目的,由資源的使用及其他關鍵性能指標可以繪制出圖5.4。圖5.4中顯示了可用資源容限、可接受服務的閱值、實際使用情況、可用性、性能和趨勢。確定通常低于設備物理極限的閡值。在給定的響應時間、特殊性能要求或可用性水平下,閥值對進行的管理服務是很有用的。
例如,為滿足特定性能的響應時間,服務器或存儲的性能可能會維持在較低的狀態。或者資源利用率可以有針對性地根據經驗和歷史的準線,令利用率低于一定的百分比,以確保在指定成本下交付可以接受的服務。
從預測和規劃的角度來看,隨著商業和應用的增長,用測量基準進行的比較可以用來確定或預測未來的資源使用需求。它的優勢在于結合資源使用和性能容量計劃,在需要時可以及時、合理地得到正確的數量和資源的類型。與跨服務器、存儲、網絡和設施的容量計劃結合后,無論何時何地,當需要用資源來支持服務器、存儲和網絡的增長時,即可保持不同的群體之間的通信。
表5.1列出了有關電能的說明和意見,包括如何轉換或解析己知的指標,以獲得一個未知的值。例如,如果你知道電力設備使用的瓦特量,除以已知的電壓,就可以確定安培量。同樣,如果你不知道設備使用的瓦特量,但你知道熱量,只要用熱量乘以0.293即可,如1000BTUXO.293=293W。例如,每瓦的I0PS指標的計算萬法是用使用能源瓦數除以I0PS量。類似地,每瓦兆赫或每瓦帶寬是能源使用的兆赫或帶寬量除以瓦特數。
有些指標是測量所得,其他的是由已得出的測量指標或不同指標的組合推導出來的。例如,存儲系統可能會在讀寫的基礎上報告讀寫數據量和1/0操作的數量。派生度量是用帶寬除以1/0操作數得到的平均1/0大小創建的。類似的,如果UO操作數量和平均1/0大小已知,相乘即可得到帶寬大小。不同的解決方案會報舌各種指標在不同層次上的細節詳情。同樣,第三方測量和報告工具會根據數據源和收集能力在報告的細節上作相應的變化。
字節數的計算是用包括二進制和十進制等在內的不同的方法(如表5.2所示兒網絡通常用bit/s計算,而存儲和相關的I/0操作以每秒的字節數來計算。這通常被記做"bit"(位)和"B"(字節)。表5.2中還有多種包括國際單位制的縮寫。
直觀上,能源應該用每秒產生的焦耳量來計算,用以與每秒的活動對照。但結合能源的利用情況,電能的測量和報吉普遍上是在1kNh仍的基礎上。例如,如果設備消耗穩定在1小時1000W,它將消耗1kNh或3600000J的能量。
指標可以瞬間暴漲達到高峰,也可能是持續的一段時間,最大值、最小值、平均值和標準偏差加上總數累積。這些指標可以用不同的時間間隔記錄和報古,例如按小時、日、周、月或年。
IT技術制造商在指定的方案下提供有關的電能消耗和(或)散熱情況的信息(BTU/h)。一些廠商提供更多的信息,包括最壞情況和最好情況的耗能資料,而其他廠商只提供了基本的最大交換機型號的信息。由供應商公布的數據應在設備上可見,如千瓦、千伏、安培、VAC或B]U等。在給定數據都可用的情況下,缺少的信息才能確定。例如,如果已知一個供應商供應的BTU/h,瓦數可以用BTU爪乘以0.293得到。這樣,一臺產熱10OOBTU/h的設備使用293W。
那些與回收、排放、空氣流通和溫度相關的指標也可以由計算而得。其他指標與服務器CPU、內存、I/0、網絡利用率、能源利用率以及當地或內部存儲性能有關。復合指標是來自于多個數據或計算。例如,當IOPS數和瓦特這種基礎指標已知時,可確定每瓦的IOPS,它可以被用來作為消耗單位能源能所做工作負載的指標。
應用程序指標包括事務量、電子郵件、文件、照片、視頻或其他處理過的文件。數據保護數量指標,包括在特定時間內幀傳輸的數據量、成功或失敗的備份或數據保護的任務、不同的任務和工作所用的時間以及其他錯誤和活動的信息。配置管理的信息包括不同類型的服務器、存儲、網絡組件、軟件和固件的數量以及它們的配置方式。
這些指標與其他的指標一起可以指示使用比率或計算占總數的百分比,如衡量服務器CPU使用率(0~100%)。百分比利用率給出了資源活動水平的相對情況,它本身并不能表示服務是如何被交付或受PCFE的影響的。例如一個服務器以50的利用率運行,可能會比85的利用率消耗更少的能量,然而,在85利用率下,應用程序的響應時間和性能可能以非線性的方式下降。服務器、存儲和網絡的性能通常會因為工作負載的增加而下降,由此可見響應時間和延遲、IOPS或帶寬以及空間利用率的重要性。