MySQL中CHAR和VARCHAR类型演变和详解


  本文标签:CHAR,VARCHAR

一、演变:

MySQL数据库的varchar类型在5.0.3以下的版本中的最大长度限制为255,其数据范围可以是0'255 。

在MySQL5.0.3及以上的版本中,varchar数据类型的长度支持到了65535,也就是说可以存放65532个字节的数据,起始位和结束位占去了3个字节,也就是说,在5.0.3以下版本中需要使用固定的TEXT或BLOB格式存放的数据可以在高版本中使用可变长的varchar来存放,这样就能有效的减少数据库文件的大小 。

如果在varchar中写入大于设定的长度,默认情况下会截去后面的部分 。

二、详解(MySQL5.1):

CHAR和VARCHAR类型类似,但它们保存和检索的方式不同 。它们的最大长度和是否尾部空格被保留等方面也不同 。在存储或检索过程中不进行大小写转换 。

CHAR和VARCHAR类型声明的长度表示你想要保存的最大字符数 。例如,CHAR(30)可以占用30个字符 。

CHAR列的长度固定为创建表时声明的长度 。长度可以为从0到255的任何值 。当保存CHAR值时,在它们的右边填充空格以达到指定的长度 。当检索到CHAR值时,尾部的空格被删除掉 。在存储或检索过程中不进行大小写转换 。

VARCHAR列中的值为可变长字符串 。长度可以指定为0到65,535之间的值 。(VARCHAR的最大有效长度由最大行大小和使用的字符集确定 。整体最大长度是65,532字节) 。

同CHAR对比,VARCHAR值保存时只保存需要的字符数,另加一个字节来记录长度(如果列声明的长度超过255,则使用两个字节) 。

VARCHAR值保存时不进行填充 。当值保存和检索时尾部的空格仍保留,符合标准SQL 。

如果分配给CHAR或VARCHAR列的值超过列的最大长度,则对值进行裁剪以使其适合 。如果被裁掉的字符不是空格,则会产生一条警告 。如果裁剪非空格字符,则会造成错误(而不是警告)并通过使用严格SQL模式禁用值的插入 。

下面的表显示了将各种字符串值保存到CHAR(4)和VARCHAR(4)列后的结果,说明了CHAR和VARCHAR之间的差别:
CHAR(4) 存储需求 VARCHAR(4) 存储需求
      4个字节 1个字节
ab ab   4个字节 ab 3个字节
abcd abcd 4个字节 abcd 5个字节
abcdefgh abcd 4个字节 abcd 5个字节
请注意上表中最后一行的值只适用不使用严格模式时;如果MySQL运行在严格模式,超过列长度不的值不保存,并且会出现错误 。

从CHAR(4)和VARCHAR(4)列检索的值并不总是相同,因为检索时从CHAR列删除了尾部的空格 。
通过下面的例子说明该差别:
复制代码 代码如下:

mysql> CREATE TABLE vc (v VARCHAR(4), c CHAR(4));
Query OK, 0 rows affected (0.02 sec)

mysql> INSERT INTO vc VALUES (ab , ab );
Query OK, 1 row affected (0.00 sec)

mysql> SELECT CONCAT(v, +), CONCAT(c, +) FROM vc;
+----------------+----------------+
| CONCAT(v, +) | CONCAT(c, +) |
+----------------+----------------+
| ab + | ab+ |
+----------------+----------------+
1 row in set (0.00 sec)


根据分配给列的字符集校对规则对CHAR和VARCHAR列中的值进行排序和比较 。

请注意所有MySQL校对规则属于PADSPACE类 。这说明在MySQL中的所有CHAR和VARCHAR值比较时不需要考虑任何尾部空格 。

例如:
复制代码 代码如下:

mysql> CREATE TABLE names (myname CHAR(10), yourname VARCHAR(10));
Query OK, 0 rows affected (0.09 sec)

mysql> INSERT INTO names VALUES (Monty , Monty );
Query OK, 1 row affected (0.00 sec)

mysql> SELECT myname = Monty , yourname = Monty FROM names;
+-----------------------------+-------------------------------+
| myname = Monty | yourname = Monty |
+-----------------------------+-------------------------------+
| 1 | 1 |
+-----------------------------+-------------------------------+
1 row in set (0.00 sec)

请注意所有MySQL版本均如此,并且它不受SQL服务器模式的影响 。

对于尾部填充字符被裁剪掉或比较时将它们忽视掉的情形,如果列的索引需要唯一的值,在列内插入一个只是填充字符数不同的值将会造成复制键值错误 。

CHAR BYTE是CHAR BINARY的别名 。这是为了保证兼容性 。

ASCII属性为CHAR列分配latin1字符集 。UNICODE属性分配ucs2字符集 。