MySQL中char与varchar类型区别
1、引言
在我们使用MySQl创建数据表结构时,为了给字符串类型的数据定义数据类型, 一般我们使用的都是char或者varchar, 那么它们到底有什么区别呢?
2、char:定长字符串类型
2.1、char特点
(1)存储空间固定。
(2)长度不够时内部存储使用空格填充。
(3)若字段本身末尾存在空格,检索出来自动截断末尾空格(因为分不清空格是字段含有的还是填充产生的)。
(4)若字段本身前端存在空格,是不会截断的。
(5)当输入的字符长度超过指定长度时,char会截取超出的字符。
例如: 当定义一个字段类型为 char(10),插入的值为"abc"这一字符串时,它们占的空间一样是10个字节,因为剩余7个位置被空格填充。
2.2、适用情况
适合存储很短的或者长度接近同一个长度的字符串。char比 varchar在存取上更具效率,因为它是固定长度。对于非常短的列,char比varchar在存储空间上也更有效率。
测试如下:
drop table if exists Test;
CREATE TABLE Test
(
id tinyint(3) unsigned NOT NULL AUTO_INCREMENT,
username char(10) NOT NULL,
PRIMARY KEY (id)
);
INSERT INTO Test(username) VALUES('test1'),('test2 '),('test3 ');
SELECT username FROM Test;
所以,由上面例子我们可以看出若字段本身末尾存在空格,检索出来自动截断末尾空格。
3、varchar:可变长字符串
3.1、varchar特点
(1)存储空间不固定,根据字段长度决定。
(2)需要额外的1个或2个字节记录字符串的长度,字符串长度小于255字节使用1个字节,否则使用2个。
(3)最大长度为 65535 字节(这里单位是字节而非字符)
(4)如果列可以为null,则需要额外的一个字节作为标志。
(5)最大长度 = 字段长度 + [长度记录:(1或2) B] + [null标志位:1B]
例如: 当定义一个字段类型为 varchar(10),插入的值为"abc"这一字符串时,那么实际存储大小为3个字节,除此之外,varchar还需要使用1个额外字节(因为"abc"字节数<255)来记录字符串的长度。
3.2、适用情况:
字符串列的最大长度比平均长度大很多。使用了像 utf-8 这样复杂的字符集,每个字符都是用不同的字节数存储。
4、char与varchar类型区别
取数据的时候,char类型会去掉末尾多余的空格,而varchar是不会的。
在时间与空间效率方面,char的存取数度要比varchar要快得多,varchar空间利用率要比char更充分。
存储方式方面,char的存储方式是,对英文字符(ASCII)占用1个字节,对一个汉字占用两个字节,而varchar的存储方式是每个英文字符占用2个字节,汉字也占用2个字节。备注:此处待考证
如下所示:
drop table if exists Test;
CREATE TABLE Test
(
id tinyint(3) unsigned NOT NULL AUTO_INCREMENT,
username varchar(10) NOT NULL,
PRIMARY KEY (id)
);
INSERT INTO Test(username) VALUES('test1'),('test2 '),('test3 ');
SELECT username FROM Test;
由上述可以看出取数据的时候,char类型会去掉末尾多余的空格,而varchar是不会的。
所以,从空间上考虑,varchar较合适;从效率上考虑,用char合适。如何使用,还需要根据实际情况查询
5、MySQL5.0.3版本之后varchar类型的变化
MySQL 5.0.3 之前,可存储0-255字节,如:varchar(20)中的20表示字节数,如果存放utf-8编码的话只能放6个汉字。varchar(n),这里的n表示字节数。备注:此处待考证
MySQL 5.0.3 之后,可存储0-65535字节,varchar(20)表示字符数,不管什么编码,汉字总能放20个。但最多占65532字节(两个字节存放长度,小于255字节用1个字节存放长度),varchar(n)这里的n表示字符数,比如varchar(200),不管是英文还是中文都可以存放200个。备注:此处待考证
MySQL中length()、char_length()的区别
(1)length():mysql里面的length()函数是一个用来获取字符串长度的内置函数。
(2)char_length():在mysql内置函数里面查看字符串长度的还有一个函数是char_length()。
(3)这两个函数的区别是:
(a)length(): 单位是字节,utf8编码下,一个汉字三个字节,一个数字或字母一个字节。gbk编码下,一个汉字两个字节,一个数字或字母一个字节。
(b)char_length():单位为字符,不管汉字还是数字或者是字母都算是一个字符。
小技巧:
length()<>char_length(),可以用来检验是否含有中文字符。
utf-8编码中判定某个字段为全英文,length(字段) = char_length(字段)即可。