三、Oracle 9i數據庫的日常性維護
在Oracle數據庫中,我們可以通過觀測一定的表或視圖來了解當前空間的使用狀況,進而作出可能的調整決定。通過對表空間的自由空間的觀察,可用來判斷分配給某個表空間的空間是太多還是不夠。關于自由空間的管理,可以利用Export及Import命令卸出和裝入表空間可以釋放大量的空間,從而緩解增加另外的數據文件的要求。
如果包含具有高插入(insert)和更新(update)活動的表的表空間中自由空間的比重下降到了15%以下,要為此表空間增加更多的空間。對于一個基本是靜態表數據的表空間,如果有多于20%的自由空間,則可以考慮減少分配給它的文件空間量。減少SYSTEM表空間的空間量比較困難,因為那要重建數據庫。
為了防止表或索引被過分擴展,及時實現對數據庫的調整,用戶應當經常對有關對象進行觀察。我們可以利用export卸出表,然后刪除表,再利用import命令將表裝入,這樣,可以將不連續的區域合并成一個連續的空間。
ORACLE 9i數據庫在AIX運行維護過程中,經常會遇到使用Shutdown(只有Internal用戶有此權)命令不能關閉數據庫的故障。不能關閉數據庫是因為數據庫有未提交事務,此時可用Shutdown Abort命令關閉數據庫,但是所有未提交事務將被廢棄。
有時候,系統管理員會發現數據庫Client端經常無故發生死機的情況,此時可在Server端使用Platinum EPM產品確認問題所在。使用EMP可以監控系統的運行,最有可能的原因是,用戶因為誤操作在數據庫中發生死鎖,引起Client 死機。經確定進程號后,到ORACLE用戶下,使用“KILL -9進程號”命令,即可釋放死鎖,解決Client端死機問題。
四、保護磁盤陣列的數據安全
企業運行的重要數據平時都保存在磁盤陣列上,因此對磁盤陣列的日常運行維護就顯得十分重要。需要做以下及幾個方面的工作:
及時檢查運行日志文件
磁盤陣列的日志文件詳細記錄了磁盤陣列內部運行情況,包括發生的每個事件序列號、嚴重級別、相關的服務器IP地址、有關設備的具體位置及事件發生的時間等內容,這些信息對于診斷和排除磁盤陣列故障十分有用。做好日志文件的日常管理工作,往往能起到防患與未然的作用。
采用RAID數據冗余技術,即使有一個物理磁盤損壞,也不會影響系統正常運行和數據的I/O,用戶也仍能夠正常訪問服務器,這時故障不易被察覺,但陣列實際上已處于安全臨界狀態,下一步就會面臨著突然宕機和存儲數據隨時丟失的危險,日志文件及時將這一情況記錄在冊,損壞的磁盤記錄為下線(off line),其所在陣列記錄為臨界狀態(critical),通過檢查日志就能夠及時發現陣列運行中存在的這個錯誤和隱患,迅速排除故障,保證陣列始終處于安全運行狀態。
定期檢查數據一致性
數據冗余是磁盤陣列主要技術之一,磁盤陣列通過數據冗余達到容錯目的,但是由于各種原因,難免會遇到冗余數據與主數據塊(Primary Data)不一致的情況,結果造成數據失效甚至宕機等現象。一致性檢查能及時發現和糾正潛在的錯誤數據,保證陣列中數據的完整性。通過對RAID互為鏡像的磁盤數據一致性檢查,或者主數據塊進行重新校驗,將產生的校驗數據與冗余數據比較,都能發現不一致的錯誤數據。一致性檢查一般間隔時間以每周1~2次為宜。
建立熱備用磁盤
熱備用磁盤也是RAID技術的又一項技術,當磁盤陣列中一個正在使用的物理磁盤發生故障后,一個待機的磁盤會立刻上線,代替此故障盤,陣列控制器根據邏輯驅動器上的冗余數據,通過校驗算法把原來存儲在故障盤上的數據重建到熱備用磁盤上。
成為熱備用磁盤必須有三個條件:一是有不小于故障盤的容量;二是平時不得存儲任何數據,也就是閑置不用;三是陣列控制器自動重建數據功能有效。在一個陣列中,只能有一個熱備用磁盤。熱備用磁盤增加了一次數據逃生的機會,系統管理員要及時更換發生故障的磁盤,并指定新的熱備用磁盤。
定時備份重要數據
配備了磁盤陣列并不意味著可以高枕無憂了,對于重要業務數據一定要備份。數據備份的介質可以是磁帶、可讀寫光盤,也可以還是磁盤。備份方式可以是通過操作系統本地備份或通過網絡系統遠程備份,目前可以采用DAS、NAS或SAN方式來進行數據備份。
在本方案中,對于7133磁盤陣列運行維護時,主要是通過它前面面板本身自帶的指示燈來判斷有無異常情況,也可以通過AIX的如diag、errpt和smit ssaraid等命令來運行和管理磁盤陣列。
Case study:7133硬盤故障的判斷與處理
舉例說明,我們有時候會在AIX系統中用#errpt –aj|more命令查看到有描述為“pdiskx error”,級別顯示為“H”類型顯示為“P”。該報錯的服務器所連接的存儲陣列很有可能發生物理硬盤損壞的故障,這時用戶可以用以下命令察看7133 RAID的狀態。
在AIX系統中用#smitty ssaraid
這時,系統將列出所有定義的SSA RAID陣列的狀態(List Status of all Defined SSA RAID Arrays),當RAID中的硬盤出現問題時,此RAID的狀態是“degraded”。這時可用以下命令判斷硬盤是否被陣列刪除:
在AIX系統中用#smit ssaraid
圖3
這時,系統將運行列出/標識 SSA物理磁盤(List/Identify SSA Physical Disks),列出刪除陣列磁盤(List Rejected Array Disks),如果看到pdiskx被陣列剔除,說明該pdiskx存在物理故障,可采取更換該pdiskx的物理硬盤的辦法來解決。
Case Study:從雙機熱備升級為SAN
目前大部分企業使用7133 磁盤陣列所采用的主要架構為 HA(雙機熱備) 架構,基本架構為兩臺IBM 小型機連接一臺 IBM 的 7133 磁盤陣列做 HACMP 架構。隨著企業應用的不斷增長,數據量的不斷增加,企業初期配置的存儲設備已經遠遠不能滿足用戶對性能及存儲容量的需求,企業對存儲設備的更新迫在眉睫。
為解決企業對容量擴展及對性能提升的需求,因此考慮了升級方案,將企業原有架構中的 7133 磁盤陣列替換為 IBM的 DS 系列光纖磁盤陣列,同時將原來7133 磁盤陣列中的數據平滑安全的遷移到新的 DS 光纖磁盤陣列中,并且在遷移過程中,盡量不中斷企業應用。同時考慮到設備利舊問題,將企業原有的 7133 磁盤陣列用作的數據庫備份系統,從而提高整體系統的性能。
圖4
升級方案一般為IBM DS 系列產品, IBM DS系列最近兩年經過了不少升級與換代,現在主流產品為DS4800/DS4700等等4Gb光纖磁盤陣列,兼顧其他DS系列產品,如 4500/4800/6800,使用8口的 SAN 交換機和數據遷移服務軟件,可實現平滑遷移用戶數據,保持用戶日常應用的正常運行。現有 7133 存儲設備可以作為數據庫備份設備繼續使用,因而可保護前期投資,降低未來投入。
圖5
整個方案通過提高存儲網絡性能從而進一步提高整個 IT 系統的整體性能;引進 SAN 光纖交換連接技術,從而提高 IT 系統的靈活性,可以更方便的引進、更新系統;可以支持各種高級的數據備份技術,包括遠程拷貝、時間點拷貝等等,簡易 GUI 管理,實現資源利用最大化利用。擁有統一的硬件平臺,圖形化管理更為方便。
作者:谷和啟,長期從事于網管,系統運行維護等工作。