ubuntu, ror, jQuery, css, website memo: sql index

index introduction
clustered index vs nonclustered index

節錄

聚簇索引非常象目錄表，目錄表的順序與實際的頁碼順序是一致的。非聚簇索引則更象書的標準索引表，索引表中的順序通常與實際的頁碼順序是不一致的。一本書也許有多個索引。例如，它也許同時有主題索引和作者索引。同樣，一個表可以有多個非聚簇索引。

聚簇索引的順序就是數據的物理存儲順序，而對非聚簇索引的解釋是:索引順序與數據物理排列順序無關。正式因為如此，所以一個表最多只能有一個聚簇索引。

在SQL Server中，索引是通過二叉樹的數據結構來描述的，我們可以這麼理解聚簇索引：索引的葉節點就是數據節點。而非聚簇索引的葉節點仍然是索引節點，只不過有一個指針指向對應的數據塊。

索引屬性

這兩種類型的索引都有兩個重要屬性：你可以用兩者中任一種類型同時對多個字段建立索引（復合索引）﹔兩種類型的索引都可以指定為唯一索引。

你可以對多個字段建立一個復合索引，甚至是復合的聚簇索引。假如有一個表記錄了你的網點訪問者的姓和名字。如果你希望根據完整姓名從表中取資料，你需要建立一個同時對姓字段和名字字段進行的索引。這和分別對兩個字段建立單獨的索引是不同的。當你希望同時對不止一個字段進行查詢時，你應該建立一個對多個字段的索引。如果你希望對各個字段進行分別查詢，你應該對各字段建立獨立的索引。

兩種類型的索引都可以被指定為唯一索引。如果對一個字段建立了唯一索引，你將不能向這個字段輸入重復的值。一個標識字段會自動成為唯一值字段，但你也可以對其它類型的字段建立唯一索引。假設你用一個表來保存你的網點的會員密碼，你當然不希望兩個會員有相同的密碼。通過強製一個字段成為唯一值字段，你可以防止這種情況的發生。

一、索引塊與數據塊的區別

大家都知道，索引可以提高檢索效率，因為它的二叉樹結構以及佔用空間小，所以訪問速度塊。讓我們來算一道數學題：如果表中的一條記錄在磁盤上佔用 1000字節的話，我們對其中10字節的一個字段建立索引，那麼該記錄對應的索引塊的大小只有10字節。我們知道，SQL Server的最小空間分配單元是「頁（Page）」，一個頁在磁盤上佔用8K空間，那麼這一個頁可以存儲上述記錄8條，但可以存儲索引800條。現在我們要從一個有8000條記錄的表中檢索符合某個條件的記錄，如果沒有索引的話，我們可能需要遍歷8000條×1000字節/8K字節=1000個頁面才能夠找到結果。如果在檢索字段上有上述索引的話，那麼我們可以在8000條×10字節/8K字節=10個頁面中就檢索到滿足條件的索引塊，然後根據索引塊上的指針逐一找到結果數據塊，這樣IO訪問量要少的多。

二、索引優化技術

是不是有索引就一定檢索的快呢？答案是否。有些時候用索引還不如不用索引快。比如說我們要檢索上述表中的所有記錄，如果不用索引，需要訪問8000 條×1000字節/8K字節=1000個頁面，如果使用索引的話，首先檢索索引，訪問8000條×10字節/8K字節=10個頁面得到索引檢索結果，再根據索引檢索結果去對應數據頁面，由於是檢索所有數據，所以需要再訪問8000條×1000字節/8K字節=1000個頁面將全部數據讀取出來，一共訪問了 1010個頁面，這顯然不如不用索引快。

ubuntu, ror, jQuery, css, website memo

2009年2月3日星期二

sql index

沒有留言:

2009年2月3日 星期二

sql index

沒有留言:

2009年2月3日星期二