SQL Server内幕之数据页

数据页是包含已添加到数据库表中的用户数据的结构。

如前所述, 数据页有三种, 每个都以不同的格式存储数据。

SQL server 有行内数据页、行溢出数据页和 LOB 数据页。

与 SQL server 中的所有其他类型的页一样, 数据页的大小固定为 8 KB 或8192字节。

它们由三主要组件组成: 页面页眉、数据行和行偏移量数组, 如图6-4 所示。

blob.png


页标题


如图6-4 所示, 页标题占据每个数据页的前96个字节 (为数据、行开销和行偏移保留8096个字节)。表6-5 列出了检查页标题时显示的一些信息。

blob.png


行内数据的数据行


页标题后面是存储表实际数据行的区域。单个数据行的最大大小为8060字节的行内数据。

行还可以在单独的页上存储行溢出和 LOB 数据。

在给定页上存储的行数根据表结构和存储的数据而变化。

具有所有固定长度列的表始终可以存储每页相同的行数;

可变长度行可以根据输入数据的实际长度, 存储尽可能多的行。

保持行长更短可以使更多行适合页面, 从而减少 i/o 并增加所需数据在缓存中的可能。


行偏移量数组


行偏移量数组是2字节项的块, 每个条目表示相应数据行开始的页面上的偏移量。

每行在这个数组中都有一个2字节的条目 (正如前面所讨论的, 当您阅读每行所需的10个开销字节时)。

虽然这些字节没有存储在数据行中, 但它们确实会影响适合页面的行数。


行偏移量数组指示页上行的逻辑顺序。

例如, 如果表具有聚集索引, SQL server 将按聚集索引键的顺序存储这些行。

这并不意味着行按聚集索引键的顺序物理地存储在页面上。

相反, 偏移量数组中的插槽0引用聚集索引键顺序中的第一行, 插槽1引用第二行, 依此类推。

正如您在检查实际页面时所看到的那样, 这些行的物理位置可以位于页面的任何位置。


查看数据页


可以使用 DBCC 页命令查看数据页的内容, 

这允许您查看数据库中任何给定页的页标题、数据行和行偏移表。

只有系统管理员才能使用 DBCC 页。

但是, 由于通常不需要查看数据页的内容, 因此在 SQL server 文档中找不到有关 DBCC 页的信息。

不过, 如果您想使用它, 下面是语法:

DBCC PAGE ({dbid | dbname}, filenum, pagenum[, printopt])


DBCC 页面命令包含表6-6 中显示的参数。

清单6-4 中的代码和结果显示来自 DBCC 页的示例输出, 其 printopt 值为1。

请注意, DBCC TRACEON (3604) 指示 SQL server 将结果返回给客户端。

如果没有此 traceflag, 则不会为 DBCC 页命令返回输出。


blob.png

正如所看到的, DBCC 页的输出分为四主要部分: 缓冲区、页标题、数据和偏移量表 (实际上是偏移量数组)。

缓冲区部分显示有关给定页的缓冲区的信息。

此上下文中的缓冲区是管理页的内存结构, 本节中的信息仅在页处于内存中时才相关。


从 DBCC 页的 "输出" 页标题部分显示页上所有标题字段的数据。

(表6-5 显示了大多数这些字段的含义。数据节包含每行的信息。

使用具有 printopt 值1或3的 DBCC 页表示插槽位置, 即每行的6个表存储257、页上的行的偏移量和行的长度。

行数据分为三部分。


左列指示显示数据所在行内的字节位置。

中间部分包含存储在页面上的实际数据, 每五列显示八个十六进制数字。

最右边的列包含数据的 ASCII 字符表示形式。 此列中只有字符数据是可读的, 尽管可能会显示某些其他数据。

"偏移量表" 部分显示页面末尾的行偏移量数组的内容。


在 DBCC 页的输出中, 您可以看到此页包含23行, 第一行 (由插槽0指示) 从偏移量 1585 (0x631) 开始。

实际存储在页面上的第一行实际上是6行, 而行偏移量数组中的偏移量为96。printopt 值为1的 DBCC 页显示 "插槽编号" 顺序中的行, 即使可以从每个插槽的偏移量中看到, 也不是在页面上实际存在行的顺序。

如果使用 printopt 值为2的 DBCC 页, 则会看到页的所有8096个字节 (标头之后) 的转储, 按它们存储在页面上的顺序排列。

相关文章
相关标签/搜索