碎片類型
由于Sybase是通過OAM頁、分配單元和擴展頁來管理數據的,所以對OLTP應用的Database Server會十分頻繁地進行數據刪除、插入和更新等操作,時間一長就會出現以下幾種情況:
1. 頁碎片
即本來可以存放在一個頁上的數據卻分散地存儲在多個頁上。如果這些頁存儲在不同的擴展單元上,Database Server就要訪問多個擴展單元,因此降低了系統性能。
2. 擴展單元碎片
在堆表中,當刪除數據鏈中間的記錄行時,會出現空頁。隨著空頁的累積,擴展單元的利用率也會下降,從而出現擴展單元碎片。帶cluster index的table也有可能出現擴展單元碎片。
當有擴展單元碎片存在,會出現以下問題:
● 對表進行處理時,常常出現死鎖;
● 利用較大的I/O操作或增加I/O緩沖區的大小也無法改變較慢的I/O速度;
● 行操作的爭用。
3. 擴展單元遍歷
帶有cluster index的table會由于插入記錄而導致頁分裂,但當刪除記錄后,頁會獲得釋放,從而形成跨幾個擴展單元和分配單元的數據,而要訪問該數據就必須遍歷幾個擴展單元和分配單元。這將導致訪問/查詢記錄的時間大大延長,開始時數據庫的性能雖然較高,但使用一段時間后性能就會下降等問題。
實際上,數據在存儲空間上排列得越緊密有序,Database Server訪問的速度就越快,消除碎片有助于提高系統的性能和更有效地利用數據存儲空間。
碎片優化方法
處理碎片有多種方法,如重新定義table的填充因子,根據table的定義刪除并重新創建索引、重建表等。
本文給出的方法是通過BCP實用程序將用戶數據庫的數據以文本形式導出,然后將用戶數據庫徹底清空、截斷,再將文本數據導入到數據庫,從而達到消除碎片的目的,具有通用性。
下面以Sun Solaris 7操作系統下的Sybase Adaptive Server Enterprise 11.5為例,說明整理數據庫數據的具體方法。
1. 備份數據庫
為防止在數據庫碎片整理過程中出現不可預見的問題,有必要先備份數據庫。
2. 創建bcp out腳本并導出數據
● 創建包含下列SQL語句的文件:
cre_bcp_out.sql
select “bcp” + name + “out ./” + name + “_out.txt -Udboname -Pdbopwd -Ssys_name -c” vfrom sysobjects where type = ‘U’
order by name
go
● isql -Udboname -Pdbopwd -Ssystemname < cre_bcp_out. sql > b_out
● 編輯輸出文件,去掉文件第一行和最后兩行無關的字符:vi b_out
● 執行腳本,將數據庫的數據導出到文本文件:sh b_out
3. 創建truncate table腳本并截斷數據庫
● 創建包含下列SQL語句的文件:
cre_trunc_out.sql
select “truncate table” + name from sysobjects where type = ‘U’
order by name
go
● isql -Udboname -Pdbopwd -Ssystemname < cre_ trunc_out. sql > trunc_out. sql
● 編輯輸出文件,去掉文件第一行和最后兩行無關的字符,并在最后一行加入 go構成完整的SQL語句:vi trunc_out
● 執行以下語句,清空數據庫的數據:
isql -Udboname -Pdbopwd < trunc_out. sql
4. 創建bcp in腳本并導入數據
● 創建包含下列SQL語句的文件:
cre_bcp_in. sql
select “bcp” + name + “in ./” + name + “_out.txt -Udboname -Pdbopwd -Ssys_name -c”from sysobjects where type = ‘U’
order by name
go
● isql -Udboname -Pdbopwd -Ssystemname < cre_ bcp_in. sql > b_in
● 編輯輸出文件,去掉文件第一行和最后兩行無關的字符:vi b_in
● 從文本中導入數據:sh b_in
5. 更新數據庫狀態
Sybase不自動維護索引的統計信息,當用truncate table截斷數據庫時,索引并沒有改變,所以必須用update statistics來確保索引的統計信息對應當前表數據的統計。
● 創建包含下列SQL語句的文件:
cre_upd_st. sql
select “update statistics” + name from sysobjects where type = “U” order by name
go
● isql -Udboname -Pdbopasswd -Ssystemname < cre_upd_st. sql > upd_st. sql
● 編輯輸出文件,去掉文件第一行和最后兩行無關的字符,在最后一行加入 go構成完整的SQL語句:
vi upd_st. sql
● 更新數據庫狀態:
isql -Udboname -Pdbopasswd -Ssystemname < upd_st. sql
至此,基本上完成了數據庫用戶表的碎片整理工作。
小結
在整理過程中,有以下兩點需要注意:
1. Tempdb的大小
當Sybase執行bcp in腳本時,會占用導入數據2倍的tempdb空間,因此在執行前要仔細估計最大的table的大小,保證有足夠的tempdb空間。當空間不夠時,要考慮用分割table或刪除陳舊數據的方法縮小table的大小,或者考慮增加tempdb的大小。
2. 數據庫配置選項的設置
當數據庫執行bcp in腳本時會產生大量的log,為保證bcp in進程不致因為log溢出而中斷,應該設置database的選項“truncate log on chkpt”為“true”。
雖然Sybase數據庫是自優化的,但只要數據庫是動態的,數據庫碎片現象就會存在。在OLTP應用的場合,隨著數據的不斷增大,系統變得越來越緩慢,并且經常出現死鎖時,應該檢查數據庫的碎片,并且采用以上方法進行優化。
實際上,應該定期做數據庫的碎片整理,保證數據庫的物理存儲經常處于最優狀態,相對于增加硬件而言,這是一種更好的保持數據庫性能的低成本的途徑。