
行政中心: | 廣州市天河區(qū)黃埔大道中662號(hào)金融城綠地中心2008室 |
開(kāi)發(fā)中心: | 廣州市天河區(qū)軟件園禾田大廈326室 |
郵 編: | 510665 |
電 話: | 020-83628993 |
傳 真: | 020-83628992 |

數(shù)據(jù)庫(kù)性能監(jiān)控
典型的應(yīng)用場(chǎng)景
Surveillance 可以幫助運(yùn)維人員輕松完成對(duì)跨地域的多個(gè)服務(wù)器,以及多種數(shù)據(jù)庫(kù)平臺(tái),進(jìn)行統(tǒng)一的主動(dòng)式監(jiān)控。
如果某臺(tái) 機(jī)器異常,管理員將得到警報(bào)信號(hào)(短信,彈出窗口,電郵,HP Openview、IBM Tivoli等方式),甚至,
如果過(guò)一段時(shí)間無(wú)人響應(yīng), Surveillance可以調(diào)用一些預(yù)先編譯好的外部腳本或程序來(lái)自動(dòng)處理一些可預(yù)見(jiàn)的異常,
保證在客戶發(fā)現(xiàn)問(wèn)題之前就可以發(fā)現(xiàn)問(wèn)題并解決問(wèn) 題。
Surveillance 提供了一整套的圖形化顯示界面,幫助用戶自上而下地了解系統(tǒng)狀態(tài)。警告提示還能引導(dǎo)運(yùn)維人員逐
步打開(kāi)相應(yīng)的圖形窗口 ,深入到問(wèn)題的根源去發(fā)現(xiàn)問(wèn)題解決問(wèn)題,而不用運(yùn)維人員去記憶眾多的腳本,有助于新人快
速上手工作。
Surveillance 利用記錄的歷史數(shù)據(jù)還原故障發(fā)生時(shí)的現(xiàn)場(chǎng),從而運(yùn)維人員可以回溯定位歷史故障原因,徹底解決隱
患。此外,歷史數(shù)據(jù)還 能基于宏觀的角度,以豐富的報(bào)表形式,真實(shí)地展現(xiàn)系統(tǒng)的運(yùn)行情況,以供趨勢(shì)分析和運(yùn)維
決策。
事件管理
提供關(guān)鍵 度量參數(shù)的無(wú)人值守監(jiān)控
依靠分析 引擎,設(shè)定的規(guī)則被不斷的分析,以確定參數(shù)沒(méi)有超過(guò)閾值設(shè)定
依靠警告 引擎,可以在事件發(fā)生時(shí),以及事件已經(jīng)被解決時(shí)發(fā)出提示或警報(bào)
改變以往 運(yùn)維部門通常事后處理的工作流程
事件管理-規(guī)則分析引擎
基于規(guī)則 機(jī)制,預(yù)定義了一整套規(guī)則,且每條規(guī)則都可定義更為靈活的參數(shù)以控制事件的產(chǎn)生
用戶可自 定義新的規(guī)則
引擎獨(dú)立運(yùn) 行
案例場(chǎng)景分析
案例場(chǎng)景一
Cache Miss %該指標(biāo)實(shí)時(shí)值竟然達(dá)到20%,平均值更高達(dá)26%,一般這個(gè)值不大于5%為佳,超過(guò)則說(shuō)明數(shù)據(jù)在內(nèi) 存中重
復(fù)使用率下降,導(dǎo)致要頻繁進(jìn) 行磁盤交互到文件系統(tǒng)查找數(shù)據(jù)。。
一個(gè)cache miss在shared pool(共享池)中發(fā)生比在data buffer中發(fā)生導(dǎo)致的成本更高,由于dictionary數(shù)據(jù)一般比
librarycache(庫(kù)緩存)中的 數(shù)據(jù)在內(nèi)存中保存的時(shí)間長(zhǎng),所以關(guān)鍵是library cache的優(yōu)化。
Recursive calls(數(shù)據(jù)字典的訪問(wèn)回調(diào))太多,不應(yīng)超過(guò)seesion數(shù)的4倍。
案例場(chǎng)景二
在 Wait Statistics的窗口里,Segment header與Data Block的wait指標(biāo)值比較值得關(guān)注。
Data Block總的wait比率達(dá)到100%,非常嚴(yán)重;如果數(shù)據(jù)塊一直處于等待的狀態(tài),則導(dǎo)致整個(gè)數(shù)據(jù)庫(kù)的訪問(wèn)效率。
調(diào)大init.ora 參數(shù) FREE_LIST_PROC 解決data block問(wèn)題。
案例場(chǎng)景三
這些是Oracle Library Cache里的一些指標(biāo),Get Miss Percent是查找對(duì)象的命中率,Pin Miss Percent是讀取
或執(zhí)行對(duì)象的命中率,Reload 是SQL重新解析的次數(shù)。
測(cè) 結(jié)果表明,SQL AREA中這些指標(biāo)的值都比較高,導(dǎo)致查詢性能下降,解決方法可以通過(guò)一方面檢查應(yīng)用
代碼,提高應(yīng)用代碼的效率,一方 面可以通過(guò)增加參數(shù)shared_pool_size的值。
案例場(chǎng)景四
該 指標(biāo)反映測(cè)試數(shù)據(jù)庫(kù)的SQL存在很大的性能調(diào)優(yōu)問(wèn)題。可以通過(guò)單擊某個(gè)指標(biāo),對(duì)該指標(biāo)下的所有值進(jìn)行
排序,通過(guò)比較,查看SQL總的占用 資源情況
通 過(guò)向下鉆取功能可以發(fā)現(xiàn)每一條SQL現(xiàn)在和歷史發(fā)生時(shí)占用資源和沖突的情況,從而可以預(yù)警開(kāi)發(fā)者如何
提高SQL的優(yōu)化能力。
案例場(chǎng)景五
數(shù)據(jù)庫(kù)的Tablespace設(shè)計(jì)不合理。
沒(méi)有一個(gè)Tablespace是AntoEx,有些表空間的使用率已達(dá)到70%,當(dāng)Percent Utilized達(dá)到或接近100%時(shí)的
隱患很大,可能會(huì)因?yàn)榉峙鋽?shù)據(jù)區(qū) 域失敗而終止應(yīng)用。
更多的數(shù)據(jù)庫(kù)性能監(jiān)控的范圍和指標(biāo)