对SQL Server内存管理的阐述


  本文标签:SQL Server内存管理

  以下的文章主要介绍的是SQL Server内存管理,在默认情况下,SQL Server 2000数据库为了平衡运行在机器上其他应用程序与SQL Server系统内部的其他组建,对内存的实际需要,实现对系统内存的动态分配和回收  。

  在早前的版本如7.0,你通过选项配置给SQL Server设定一个大小固定的内存;然而  。除非你有具体的问题要求分配大小规定的内存,否则最好是让SQL Server动态管理内存  。

  无论内存是以动态还是固定的方式进行分配,计算机系统为每个SQL Server内存管理实例分配的总的内存空间都可看做一个单个统一的缓冲区(unified cache),这些内存都以多种内存池(memory pool)的方式进行管理  。每个内存池有各自的策略和用途,系统中的各个内部组件可以请求和授权使用池中的内存  。

  

  缓冲区管理和内存池(The Buffer Manager an Memory Pools)

  SQL Server中主要的内存组件是缓冲池(buffer pool)  。任何不被其他内存相关组件使用的内存都放在缓冲池中  。缓冲池负责从硬盘上加载数据和索引页以供用户访问和共享数据  。当其他组件申请内存时,它们向缓冲池发送一个缓冲请求  。内存缓冲由若干个页组成,其中每页大小与数据或索引页大小相同(8K)  。

  缓冲区管理器(The buffer Manager)

  SQL Server的进程(process)只能访问内存中的数据或索引页  。不允许直接访问磁盘上的页  。缓冲区管理器(The buffer Manager)是一个用来管理和控制物理磁盘中的页在内存中的进程  。当某个进程需要访问数据或索引页时,该页必须首先在缓冲区存在  。

  如果访问的页在内存中不存在,则必须进行一次物理I/O访问来加载该页,这样进程就可以访问该页在内从中的拷贝了  。因为物理I/O的访问是非常昂贵和耗时的,所以尽可能减少系统的物理I/O  。一种解决方案就是给SQL Server提供更多内存  。越多的页驻留在内存,当某个页被访问时就越有可能在内存中找到该页  。

  内存缓冲区的访问(Accessing Memory Buffers)

  对SQL Server中进程来讲,一个数据库就像带有编号页的简单序列  。数据库中的页可以用数据库编号、文件编号、页的编号来唯一标识  。当一个进程访问一个页时,它向缓冲管理器发送一个请求,该请求指出要访问数据所在的数据库编号、文件编号、和页编号  。

  为了更快地访问内存中的数据和避免数据页的内存扫描(memory scans),对缓冲池的页进行散列处理,以提供更快地访问  。散列(Hashing)是一种同过一个散列函数把一个key映射到一个散列桶(hansh bucket)的技术  。

  散列桶是一种内存中的数据结构,该数据结构包含一个指针数组(以链表方式实现),每个指针指向一个缓冲页(buffer page)  。A linked list chain of hash pages is built when the pointers to buffer pages do not fit on a single hash page. 散列桶的数量是SQL Server内存管理根据缓冲池大小动态进行调整  。

  在SQL Server中,散列值是由数据库编号、文件编号、页编号相结合生成的  。散列函数生成散列值并保存在散列桶中  。本质来讲,散列桶就是访问内存页的一个索引  。即使在一个大的内存环境中,散列技术可以允许SQL Server内存管理快速查找内存中的具体数据页而这需要一些内存读操作  。利用散列算法也让SQL Server快速判断某个请求的页是否在内存中,而不需要一个内存缓冲区的扫描  。

  如果被请求的页在内存中,缓冲区管理者返回一个指向内存缓冲区的指针,该内存缓冲区即为该进程请求的数据页  。如果页不在内存中,则缓冲区管理者必须首先进行一次磁盘I/O操作把请求页读到内存缓冲区中,然后把指向该内存的指针返回给发送请求的进程  。

  如果请求页的进程最终对页中的任何信息进行了修改,该页就被标记为“脏页(dirty)”,当进行完成了对页的修改,缓冲区管理者会收到一个通知  。缓冲区管理者协同日志和事务管理者,负责确保被修改的页写到了磁盘上  。