对SQL Server索引的统计概述


  本文标签:SQL Server索引

  以下的文章主要是向大家讲述的是SQL Server索引的统计(Index Statistics),正如前文我们所提到的,键的选择性是决定当执行一个查询时是否使用索引的重要因素  。SQL Server在系统表sysindexs的statblob字段中存储了键的选择性和样本直方图的值  。

  查询优化器正是基于索引键对应于该列中的值和查询中的SARG,来决定使用哪个索引  。

  

  Statblob列是一个image类型列,为了看到存储在该列中的统计信息,可使用DBCC SHOW_STATISTICS命令,该命令返回下列信息:

  

  一个直方图  。它包含了SQL Server索引键的第一列的偶数个样本值  。SQL Server在直方图中至多存储200个样本值  。

  

  索引中的组合列的索引密度  。索引密度表明了SQL Server索引键的唯一性,本节随后将讨论  。

  

  计算统计信息时表中行数  。

  

  用于抽样生成统计信息的行数  。

  

  直方图中存储的样本值的个数  。

  

  键的平均长度值  。

  

  统计计算的日期和时间  。

  

  DBCC SHOW_STATISTICS语法如下:

  DBCC SHOW_STATISTICS (tablename, index)

  Listing 34.1显示了authors表中的在au_lname和au_fname列的aunmind非聚集SQL Server索引的统计信息  。

  1. Sql代码   
  2. Dbcc show_statistics (authors, aunmind)   
  3. Go   
  4. Dbcc show_statistics (authors, aunmind)  
  5. Go  
  6. Statistics for INDEX aunmind.   
  7. Updated Rows Rows Sampled Steps Density Average key length   
  8. Aug 6 2001 1:34AM 23 23 22 0.0 24.52174   
  9. All density Average Length Columns   
  10. 4.5454547E-2 7.3913045 au_lname   
  11. 4.3478262E-2 13.52174 au_lname, au_fname   
  12. 4.3478262E-2 24.52174 au_lname, au_fname, au_id   
  13. (3 row(s) affected)   
  14. RANGE_HI_KEY RANGE_ROWS EQ_ROWS DISTINCT_RANGE_ROWS AVG_RANGE_ROWS   
  15. Bennet 0.0 1.0 0 0.0   
  16. Blotchet-Halls 0.0 1.0 0 0.0   
  17. Carson 0.0 1.0 0 0.0   
  18. DeFrance 0.0 1.0 0 0.0   
  19. del Castillo 0.0 1.0 0 0.0   
  20. Dull 0.0 1.0 0 0.0   
  21. Green 0.0 1.0 0 0.0   
  22. Greene 0.0 1.0 0 0.0   
  23. Gringlesby 0.0 1.0 0 0.0   
  24. Hunter 0.0 1.0 0 0.0   
  25. Karsen 0.0 1.0 0 0.0   
  26. Locksley 0.0 1.0 0 0.0   
  27. MacFeather 0.0 1.0 0 0.0   
  28. McBadden 0.0 1.0 0 0.0   
  29. OLeary 0.0 1.0 0 0.0   
  30. Panteley 0.0 1.0 0 0.0   
  31. Ringer 0.0 2.0 0 0.0   
  32. Smith 0.0 1.0 0 0.0   
  33. Straight 0.0 1.0 0 0.0   
  34. Stringer 0.0 1.0 0 0.0   
  35. White 0.0 1.0 0 0.0   
  36. Yokomoto 0.0 1.0 0 0.0   

  分析上面的输出,你能推算出统计最后的修改时间是2001年8月6日  。当生成计信息时该表共有23行(Rows),所有23行都用来抽样生成统计信息(Rows Sampled)  。键值的平均长度为24.52174字节(Average Key Length)  。根据密度信息(Density),你能看到该SQL Server索引具有高选择性(低密度意味着高选择性——索引密度后面将涉及到)  。表中23行数据,其中22行具有唯一值  。