DB2 V9.7 分区索引新特征之改进大型数据库


  本文标签:DB2 分区索引

  此文章主要向大家描述的是DB2 V9.7 分区索引新特性之改进大型数据库的实际操作性能的描述,其中主要包括如何正确的使用与管理分区索引,还有分区索引改进大型数据库性能的实际操作步骤  。

  简介

  分区索引(partitioned index)是 DB2 V9.7 中的新特性,在本文中将介绍什么是分区索引,如何创建和管理DB2 V9.7 分区索引,分区索引如何改进大型数据库性能,读者将获得对分区索引的第一手体验  。每个DB2 V9.7 分区索引由多个索引分区(index partition)组成,每个索引分区只对相应的数据分区(data partition)的数据作索引  。

  开始之前

  在开始讨论分区索引之前我们有必要复习一下 DB2 的表分区特性,这一特性是在 DB2 V9 引入的,developerworks 上的这篇文章 “ DB2 9 表分区 - 改进大型数据库的管理” 是一个很好的参考  。

  表分区是一种数据组织模式,在这种模式中,数据将以一个或多个表列的值为依据,分割到多个称为数据分区(或范围)的存储对象中  。每一个数据分区被分别存储  。这些存储对象可以位于不同的表空间中,可以位于相同的表空间中,也可能是这两种情况的组合  。

  表分区特性改进了大型数据库的管理,用户可以灵活的放置索引,在图 1 中,在分区表上建立了两个索引,每个索引分别放置在一个表空间中  。但是我们同时也看到,每一个索引中的键值指向了所有数据分区的数据库,在表数据量很大的情况索引也会变得很大  。

  图 1. DB2 v9 中表分区特性及其索引

  

图 1. DB2 v9 中表分区特性及其索引

  另外,表分区特性使得用户可以使用 ALTER TABLE … ATTACH PARTITION 命令和 DETACH PARTITION 命令轻易的实现表数据的转入( roll-in )和转出( roll-out) ,这两个操作都不需要有任何数据的移动,从而很大的提高性能  。同时我们也看到,这两个操作之后需要对索引进行维护,例如 ATTACH 一个新的分区之后需要为这个分区的新数据进行索引, DETACH 一个分区之后需要将索引中相应的键值清除  。

  

  分区索引简介

  在 DB2 V9.7 之前,分区表上的索引是不能分区的  。由于分区表很多情况都是应用在数据仓库环境中,当数据量很大的时候,索引也随之变得很大,从而导致一些的性能上降低  。

  在 DB2 V9.7 中,索引也可以是分区的,这一特性称之为分区索引(partitioned index)  。DB2 V9.7 分区索引由多个索引分区(index partition)组成,每个索引分区中的键值指向相应的唯一一个数据分区(data partition)的数据,系统创建的索引或者用户的创建的索引都可以是分区索引  。

  在图 2 中,在一个有 4 个数据分区的分区表上建立了三个索引,其中 index1 和 index2 是分区索引,分别由 4 个索引分区组成,index3 是非分区索引(nonpartitioned index),或者称之为全局索引(global index),相对应的,我们可以把分区索引称为本地索引(local index)  。

  图 2. DB2 V9.7 中的分区索引

  

图 2. DB2 V9.7 中的分区索引

  分区索引带来的一个显著优势在于,在使用 ALTER TABLE ATTACH PARTITION 和 DETAICH PARTITION 命令进行数据的转入( roll-in )和转出( roll-out) 时, 使用分区索引能够很大程度的提高性能  。

  

  在 DB2 V9.7 中,以下类型的索引不能是分区索引,只能是非DB2 V9.7 分区索引  。

  XML 索引

  空间数据( spatial data )索引

  

  MDC 块索引( block index ,系统生成索引)

  

  XML path index (系统生成索引)

  

  准备工作

  

  在开始之前,我们先创建一个新的数据库名字叫做 MYDB,如清单 1 所示  。当然用已经存在的数据库也可以,但是为了能够简化环境,清楚的、逐步的进行我们接下来的讨论,建议使用一个全新的数据库  。

  本文中所有操作都是在 LinuxAMD64 平台上的 DB2 V97 版本进行,V97 版本之前的版本都没有DB2 V9.7 分区索引特性  。

  清单 1. 创建数据库

  

  db2 CREATE DB mydb

  

  创建数据库之后我们创建若干个表空间,如清单 2 所示  。

  清单 2. 创建表空间

  

  1. CREATE TABLESPACE TbspT MANAGED BY DATABASE using (FILE tspT 4 M) AUTORESIZE YES;   
  2. CREATE TABLESPACE TbspX MANAGED BY DATABASE using (FILE tspX 4 M) AUTORESIZE YES;   
  3. CREATE TABLESPACE TbspD MANAGED BY DATABASE using (FILE tspD 4 M) AUTORESIZE YES;   
  4. CREATE TABLESPACE TbspY MANAGED BY DATABASE using (FILE tspY 4 M) AUTORESIZE YES;   
  5. CREATE TABLESPACE TbspW MANAGED BY DATABASE using (FILE tspW 4 M) AUTORESIZE YES;   

  完整内容的学习,请访问:

  

  http://www.ibm.com/developerworks/cn/data/library/techarticles/dm-0907haoqy/