前言 我們見到過很多帶有巨大性能問題的Oracle應用程序和電子商務套件安裝。我們得出的結(jié)論是:這些安裝都可以在性能方面取得進一步的提升。換句話說,性能已經(jīng)很高,幾乎不能得到再得到改善的安裝是很少見的。 有爭議的問題
針對產(chǎn)品系統(tǒng)堆棧而言,我們的底部端對端性能調(diào)優(yōu)方法總是很快產(chǎn)生成果,比我們認為的遵循廣泛的備忘列表要快。我提出以下一些問題共討論:
大部分性能改善的可能性都是在應用程序級上:這條結(jié)論來自Metalink上關于性能調(diào)優(yōu)的一個顯著的注釋。這條結(jié)論和我們的經(jīng)驗性能調(diào)優(yōu)系統(tǒng)堆棧沒有統(tǒng)計意義上的關系。
平均需要兩天的時間:這是書上做出的結(jié)論。但我們的經(jīng)驗不支持這個結(jié)論。我認為得出一個Oracle應用程序性能改善的策略最少應該需要12天。第一天早晨開會是很常見的事。最后兩天主要用來完成行政方面和技術級上的有關發(fā)現(xiàn)、勝利和緊接著的推薦的文檔工作�?梢钥鋸埖卣f,如果一個性能改善不被記錄下來形成文檔,那么以后很難再重復類似的性能改善。如果對出現(xiàn)的問題不記錄下來形成文檔,那么很可能它會再次發(fā)生。如果一個問題及其解決方法不被記錄下來形成文檔的話,對它的監(jiān)測將非常困難。
擴展碎片:對于聯(lián)機事務處理系統(tǒng),這應該不是一個問題。我們聽過很多有關“聯(lián)機事務處理系統(tǒng)”對碎片嚴重的表(這些表完全是鍵值惟一的)進行事務處理不會影響性能的說法。但是,我們應該經(jīng)常性地重組以消除碎片,這會帶來性能上的巨大改善。Oracle存儲管理改善正在向?qū)⑺槠瑤淼挠绊懽钚』筇げ降剡~進。
由于緩沖輸入輸出不是大問題,所以需要對磁盤輸入輸出進行性能調(diào)優(yōu):這里有兩點需要說明。磁盤輸入輸出的實際開銷并不是內(nèi)存緩沖輸入輸出的一萬倍。真實的比值接近70。即使你的CPU似乎正在抵銷這個代價,并且不帶來任何顯著的性能問題,但是這個問題顯然會限制你的系統(tǒng)的可伸縮性。隨著時間的流逝,我們越來越重視過高的內(nèi)存緩沖輸入輸出,同時找尋性能改善的機會。
OATablespace模型和遷移工具集:已發(fā)布的Metalink注釋(10/03)聲稱“這個新模型帶來了實時性能改善�!边@個模型的概念是將100多個Oracle應用程序表空間合并成一個以10計數(shù)的表空間。這會帶來潛在的存儲空間節(jié)省么?或許。這會帶來更高的操作效率么?它依賴于其他東西。我們還沒有講解這個工具集。但是我們已經(jīng)理解了在白板級上的表空間合并是如何改善性能的。
對你的個人電腦客戶端進行磁盤碎片整理:在這本書中有關這個問題的討論很多。這或許是正確的,因為在寫作本書時正流行“胖客戶端”。但是現(xiàn)在,Oracle應用程序客戶端是一個“瘦客戶端”(從Oracle廢除Jinitiator開始,我們稱瀏覽器為瘦客戶端),不要期待能從對你的個人電腦客戶端硬盤驅(qū)動器進行磁盤碎片整理中得到性能提升。
載入模塊補丁:這是Oracle技術支持對于性能問題經(jīng)常給出的對策,其實在很多情況下,它并不合適。原因是打補丁經(jīng)常會帶來不穩(wěn)定性。如果對于補丁的依賴性沒有給予充分考慮,你可能會發(fā)現(xiàn)你不得不載入整個補丁包,而你根本就沒打算載入它們,結(jié)果就是對你系統(tǒng)的堆棧穩(wěn)定性產(chǎn)生了影響。
項目管理
項目管理是很關鍵的。Oracle應用程序性能實施即是技術上的也是行政上的。某個人必須出來做掌舵者,即項目管理者。必須按功能區(qū)分出不同的優(yōu)先次序。如果有可能,可以按照以下方式:商業(yè)單位先計算他們選拔人才的時間延遲帶來的財政開支,然后乘上用戶的數(shù)量及其每分鐘的收入。獲得應用程序性能改善的開銷之一就是要記錄文檔。同時,也需要記錄大量的紙質(zhì)文檔。用戶的欲望必須被管理起來,因為并不是所有的區(qū)域都會產(chǎn)生同樣戲劇性的結(jié)果。必須有一個管理者來劃分不同的優(yōu)先次序,有些時候甚至需要對性能團隊的訪問進行過濾。一方面,用戶會頻繁地提出會導致底層性能問題的主意和要求。另一方面,和用戶進行交互可能會妨礙你的工作進度。成功也會導致暴露下一層性能問題的出現(xiàn)。
什么是用戶不能告訴你的
針對某個用戶的從底向上的方法揭示了一個單獨的包消耗的輸入輸出資源占全部的25%左右。對另一個用戶而言,一個單獨的查詢可能會引起每周4.3TB的緩沖輸入輸出。性能調(diào)優(yōu)使得緩沖開銷降至原先的0.06%。問題是它會耗盡CPU資源,同時,在那種情況下,是否對CPU進行擴充還需慎重考慮。沒有人知道系統(tǒng)堆棧正在抵銷這個代價。
關于性能調(diào)優(yōu)保守最嚴密的一個秘密在Oracle性能調(diào)優(yōu)指南中被發(fā)現(xiàn)的。作為一個團隊,我們發(fā)現(xiàn)這個秘密已經(jīng)多年了。對于beta級或產(chǎn)品系統(tǒng)的性能問題,你應該從系統(tǒng)的最底層堆棧開始診斷。不幸的是,性能診斷經(jīng)常僅僅集中在系統(tǒng)堆棧中間的四個部分。它們是:
* 邏輯數(shù)據(jù)庫結(jié)構
* 數(shù)據(jù)庫操作
* 訪問路徑(SQL)
* 內(nèi)存分配
但是,我們經(jīng)�?梢栽贠racle底層的幾個級別上發(fā)現(xiàn)很大的性能問題,如下所示:
* 輸入輸出和物理數(shù)據(jù)庫結(jié)構
* 資源競爭 * 底層操作系統(tǒng)平臺
藏寶圖
在Oracle性能調(diào)優(yōu)級上,藏寶圖就是v$sqlarea視圖。如果我是一個IT管理者,我將會記住這個視圖的名字。并且,每當我在大廳遇見我的數(shù)據(jù)庫管理員時,我都會問他們這周他們查詢這個視圖的次數(shù)。
Metalink 注釋 235146.1給出了對這個視圖進行查詢的一些樣例。例如:
select sql_text, executions, buffer_gets, disk_reads, rows_processed,
sorts, address, first_load_time, HASH_VALUE, module
from v$sqlarea
where executions > 0
order by reads_per desc
最近,越來越多的Oracle 9i版本加入了模塊(MODULE)這個列,該列揭示了Oracle應用程序的模塊名稱。
統(tǒng)計包
在很多大型企業(yè)中,統(tǒng)計包的使用仍然被忽視。這可能是帶有脅迫性的報道。不要犯試圖僅僅讀取輸出結(jié)果,就能獲取所有信息的錯誤,即使是第一頁就足以告訴你這份報道中剩下的你應該重視的10%在哪兒。Oracle 9.2版本的統(tǒng)計包,現(xiàn)在包含CPU和消耗時間列。以前,為了將長時間運行的SQL語句排序到最頂端,我們不得不開啟“追蹤”,連接追蹤文件,并將它們交付程序tkprof來處理。對于那些一個簡單的“追蹤”就要處理多達10GB數(shù)據(jù)的大型企業(yè)而言,這是不現(xiàn)實的。
讓用戶參與到性能調(diào)優(yōu)中去
將這條建議(即,讓用戶參與到性能調(diào)優(yōu)中去)寫入書中的人應該因其創(chuàng)造性而得到贊譽。讓你的用戶也參與到性能診斷中去。購買一臺Oracle應用程序評測個人電腦,并把它給用戶使用。不要使用與個人電腦類似的配置好的筆記本,因為在同樣規(guī)范的情況下,筆記本沒有個人電腦的同樣性能特性。配置清單如下:
* 750 MB CPU
* 256 MB 內(nèi)存
* Windows 2000 企業(yè)版(第四版)
* 使用獨立的邏輯磁盤
* Jinitiator-鎖定版
* 標準軟件,例如Office 2003
供評測用的個人電腦不需要以下配置:
* 墻紙
* 屏幕截圖
* 工具條
* 常駐程序
將評測用個人電腦送上用戶的桌面,帶著性能問題。將用戶的電腦接入局域網(wǎng),讓用戶工作一段時間。然后,再將用戶的電腦放進計算機房間,并把它接入中間層,讓用戶在它上面進行更多的工作。評測用個人電腦消除了用戶方對Oracle應用程序性能的主觀性,同時也消除了面對用戶抱怨性能問題你們的主觀性。
索引計數(shù)和性能
回到70年代,開發(fā)者指南基本上說不要在一個表上建立4到5個索引。今天,開發(fā)者指南上的注釋如下:
Oracle不限制在一個表上建立索引的個數(shù)。盡管如此,你需要考慮索引所帶來的性能改善,以及你的數(shù)據(jù)庫應用程序的實際需要,從而決定需要對哪些列建立索引。
事實是:每個Oracle應用程序表可能包含30多個索引。如果我們加入一個索引能將經(jīng)常需要的SQL語句的輸入輸出減少,我們會不考慮高索引計數(shù)的問題而加入這個索引。
CPU
減小并發(fā)管理池的寬度,至今我們還沒發(fā)現(xiàn)這會阻塞任務的進行。我們經(jīng)常會看到的情景是:減小并發(fā)管理池的寬度實際上增加了批處理任務的吞吐量,它也使CPU不那么忙碌。有許多包含對等進程的任務必須被完成。如果一個任務的池寬度過窄,所需的任務可能永遠也得不到處理,從而阻塞整體任務。
我們和Oracle應用程序安裝小組、培訓者打過交道,他們喜歡增加并發(fā)管理池的寬度,而無視對CPU的影響,這種設置一直保持到產(chǎn)品發(fā)布時仍然存在。在訓練和測試環(huán)境中,安全問題的大門是開著的,并且安裝者增加并發(fā)管理池的寬度以期望他們的批處理任務可以盡早完成。他們這樣做或許根本沒有考慮到對CPU的影響,CPU可能會因此而被完全占用。
CPU運行隊列不應該比你的CPU計數(shù)的兩倍還深。如果CPU在一天中被經(jīng)常性完全占用,就必須放棄某些設置。尋找這個需要被放棄的設置的第一位置就應該是并發(fā)管理池。
結(jié)論:
Oracle日常維護和性能調(diào)優(yōu),不是單純的技術,指定科學嚴謹?shù)墓芾砭S護計劃更重要,一定要將調(diào)優(yōu),維護過程中的所有為難題記錄,形成文檔,在知識經(jīng)驗上得到積累,不至于同樣的錯誤犯兩次;
記錄運行日志,什么時候系統(tǒng)性能差,速度慢;然后分析找出原因,指定解決的辦法;
調(diào)優(yōu)分兩部分:
一.應用層,包括邏輯數(shù)據(jù)庫結(jié)構,數(shù)據(jù)庫操作,訪問路徑(SQL),內(nèi)存分配等.優(yōu)化的方法有,分解大表,修改關鍵表結(jié)構,分析應用層的sql語句,優(yōu)化,使之達到最優(yōu)執(zhí)行;配置參數(shù),恰當?shù)胤峙鋬?nèi)存;定期分析,重建索引,移動表,消除碎片;
二.系統(tǒng)層,包括輸入輸出和物理數(shù)據(jù)庫結(jié)構,資源競爭,底層操作系統(tǒng)平臺等;根據(jù)系統(tǒng)應用的規(guī)模,選擇恰當?shù)奈募到y(tǒng),這樣可以達到減少io操作的次數(shù);操作系統(tǒng)是支撐大規(guī)模的吞吐量,window是微內(nèi)河,linux/unix是宏內(nèi)核,造成了在系統(tǒng)內(nèi)進程間通信的速度和操作性能的差異等.
根據(jù)需求->指定運維計劃->分析運行日志->更該運行計劃->分析運行日志....這樣一個反復的過程
|