數(shù)據(jù)庫(kù)性能監(jiān)控

 

典型的應(yīng)用場(chǎng)景

* Surveillance 可以幫助運(yùn)維人員輕松完成對(duì)跨地域的多個(gè)服務(wù)器,以及多種數(shù)據(jù)庫(kù)平臺(tái),進(jìn)行統(tǒng)一的主動(dòng)式監(jiān)控。

* 如果某臺(tái) 機(jī)器異常,管理員將得到警報(bào)信號(hào)(短信,彈出窗口,電郵,HP Openview、IBM Tivoli等方式),甚至,

   如果過(guò)一段時(shí)間無(wú)人響應(yīng), Surveillance可以調(diào)用一些預(yù)先編譯好的外部腳本或程序來(lái)自動(dòng)處理一些可預(yù)見(jiàn)的異常,

   保證在客戶發(fā)現(xiàn)問(wèn)題之前就可以發(fā)現(xiàn)問(wèn)題并解決問(wèn) 題。

* Surveillance 提供了一整套的圖形化顯示界面,幫助用戶自上而下地了解系統(tǒng)狀態(tài)。警告提示還能引導(dǎo)運(yùn)維人員逐

   步打開(kāi)相應(yīng)的圖形窗口 ,深入到問(wèn)題的根源去發(fā)現(xiàn)問(wèn)題解決問(wèn)題,而不用運(yùn)維人員去記憶眾多的腳本,有助于新人快

   速上手工作。

* Surveillance 利用記錄的歷史數(shù)據(jù)還原故障發(fā)生時(shí)的現(xiàn)場(chǎng),從而運(yùn)維人員可以回溯定位歷史故障原因,徹底解決隱

   患。此外,歷史數(shù)據(jù)還 能基于宏觀的角度,以豐富的報(bào)表形式,真實(shí)地展現(xiàn)系統(tǒng)的運(yùn)行情況,以供趨勢(shì)分析和運(yùn)維

   決策。

 

事件管理

* 提供關(guān)鍵 度量參數(shù)的無(wú)人值守監(jiān)控

* 依靠分析 引擎,設(shè)定的規(guī)則被不斷的分析,以確定參數(shù)沒(méi)有超過(guò)閾值設(shè)定

* 依靠警告 引擎,可以在事件發(fā)生時(shí),以及事件已經(jīng)被解決時(shí)發(fā)出提示或警報(bào)

* 改變以往 運(yùn)維部門通常事后處理的工作流程

事件管理-規(guī)則分析引擎

* 基于規(guī)則 機(jī)制,預(yù)定義了一整套規(guī)則,且每條規(guī)則都可定義更為靈活的參數(shù)以控制事件的產(chǎn)生

* 用戶可自 定義新的規(guī)則

* 引擎獨(dú)立運(yùn) 行

案例場(chǎng)景分析

案例場(chǎng)景一

* Cache Miss %該指標(biāo)實(shí)時(shí)值竟然達(dá)到20%,平均值更高達(dá)26%,一般這個(gè)值不大于5%為佳,超過(guò)則說(shuō)明數(shù)據(jù)在內(nèi) 存中重

   復(fù)使用率下降,導(dǎo)致要頻繁進(jìn) 行磁盤交互到文件系統(tǒng)查找數(shù)據(jù)。。

* 一個(gè)cache miss在shared pool(共享池)中發(fā)生比在data buffer中發(fā)生導(dǎo)致的成本更高,由于dictionary數(shù)據(jù)一般比

   librarycache(庫(kù)緩存)中的 數(shù)據(jù)在內(nèi)存中保存的時(shí)間長(zhǎng),所以關(guān)鍵是library cache的優(yōu)化。

* Recursive calls(數(shù)據(jù)字典的訪問(wèn)回調(diào))太多,不應(yīng)超過(guò)seesion數(shù)的4倍。

案例場(chǎng)景二

*  在 Wait Statistics的窗口里,Segment header與Data Block的wait指標(biāo)值比較值得關(guān)注。

*  Data Block總的wait比率達(dá)到100%,非常嚴(yán)重;如果數(shù)據(jù)塊一直處于等待的狀態(tài),則導(dǎo)致整個(gè)數(shù)據(jù)庫(kù)的訪問(wèn)效率。

   調(diào)大init.ora 參數(shù) FREE_LIST_PROC 解決data block問(wèn)題。

案例場(chǎng)景三

* 這些是Oracle Library Cache里的一些指標(biāo),Get Miss Percent是查找對(duì)象的命中率,Pin Miss Percent是讀取

   或執(zhí)行對(duì)象的命中率,Reload 是SQL重新解析的次數(shù)。

* 測(cè) 結(jié)果表明,SQL AREA中這些指標(biāo)的值都比較高,導(dǎo)致查詢性能下降,解決方法可以通過(guò)一方面檢查應(yīng)用

   代碼,提高應(yīng)用代碼的效率,一方 面可以通過(guò)增加參數(shù)shared_pool_size的值。

案例場(chǎng)景四

* 該 指標(biāo)反映測(cè)試數(shù)據(jù)庫(kù)的SQL存在很大的性能調(diào)優(yōu)問(wèn)題。可以通過(guò)單擊某個(gè)指標(biāo),對(duì)該指標(biāo)下的所有值進(jìn)行

    排序,通過(guò)比較,查看SQL總的占用 資源情況

* 通 過(guò)向下鉆取功能可以發(fā)現(xiàn)每一條SQL現(xiàn)在和歷史發(fā)生時(shí)占用資源和沖突的情況,從而可以預(yù)警開(kāi)發(fā)者如何

   提高SQL的優(yōu)化能力。

案例場(chǎng)景五

* 數(shù)據(jù)庫(kù)的Tablespace設(shè)計(jì)不合理。

* 沒(méi)有一個(gè)Tablespace是AntoEx,有些表空間的使用率已達(dá)到70%,當(dāng)Percent Utilized達(dá)到或接近100%時(shí)的

  隱患很大,可能會(huì)因?yàn)榉峙鋽?shù)據(jù)區(qū) 域失敗而終止應(yīng)用。

更多的數(shù)據(jù)庫(kù)性能監(jiān)控的范圍和指標(biāo)

版權(quán)所有: 2004-2021 卓為科技
粵ICP備20006707號(hào)