一:sql 将数据类型分为四大类:数值类型,字符串,日期时间型,枚举类型
1、数值类型可以划分为数值类型:整型,浮点十进制类型。
所谓的“十进制”是指decimal和numeric,他们是同一类型的。严格地说,它不是一个数字类型,因为他们实际上是作为字符串存储,每一个数字值(包括小数点)占一个字节的存储空间,所以这种类型的消耗大量的存储空间,但它的优点是它的价值不会失去做浮点数计算精度,它更适合一些计算精度要求高,如价格计算。浮动取决于不同精度的类型可以是float或double。它们的优点是小数的精度,FLOAT可以表示非常小的值,可以是最小的值约1.17E-38(0.000 … 0117,小数点后的37零),双重可以表达更小的数,最小的数可以约2.22E-308(0.000 … 0222,小数点以及后跟307个零)的小数。float和double分别为4字节和8字节的存储空间。
对于整型,在MySQL中有很多不同类型的整数,在设计数据库表,我们可以有一个字节TINYINT或8字节BIGINT等,所以我们应该把过多考虑哪个类型来使用,以获得最小的存储空间,而不会失去任何准确性值。
TINYINT,SMALLINT,MEDIUMINT,INT和BIGINT 1字节,2字节,3字节,4字节和8字节。对于无符号整数,这些类型能表示的最大整数是分别255,65535,16777215,4294967295 18446744073709551615。如果我们需要保存用户的年龄,TINYINT就够了;如果是自增的ID,我们应该使用MEDIUMINT而不是INT,INT还 是太大了。很多数据表并不会达到MEDIUMINT的范围
2、日期时间输入的日期和时间类型比较简单
如DATE,TIME,DATETIME,TIMESTAMP和YEAR。如果我们只需要关心的日期,但没有分秒我们应该使用Date,而不是DATETIME,但DATETIME是其中最常用的,一切按实际需要设计
3、字符类型不要以为字符类型仅仅是CHAR
CHAR和VARCHAR的区别是,CHAR是固定长度。如果你定义一个字段CHAR(10),那么无论多少字节的数据,这将需要10个字节的空间;对于18位的身份证号码,则应该使用Char(18),
VARCHAR是可变长度的,如果我们有一个字段的值有不同的长度,那么我们应该使用VARCHAR 。
4、枚举和集合类型枚举(ENUM)类型
最多可以定义到65,535种不同的字符串从中做出选择。
这可能需要取决于有多少个值在枚举类型中的一个或两个字节。集合(SET)类型,最多可以有64个不同的成员,你可以选择零个或多个成员,集合成员的数量决定。例如,在SQLServer中,你可以使用BIT类型来表示性别(男/女),但MySQL中,BIT在不同版本数据库中取值有差异,而使用TINTINT有时浪费的,你可以用ENUM('男','女'),这样可以节约很大空间
二:如何选址数据类型
一般原则
更小的通常越好
尽量选择使用可以正确存储数据的最小数据类型。更小的数据类型通常更快,
因为它们占用更少的磁盘、内存和 CPU 缓存,并且处理时需要的 CPU 周期也更少;
简单最好
整型比字符型要好,两个例子,应该使用 MySQL 内建的类型来存储日期而不是字符串;
使用整形存储 IP 地址。因为字符的校对、排序规则要复杂。
尽量避免 NULL
通常情况下最好指定列为 NOT NULL,除非真的需要存储 NULL 值;
如果查询中包含可为 NULL 的列,对 MySQL 来说更难优化,
因为可为 NULL 的列是的索引、索引统计和值比较,都更为复杂。
允许为 NULL 的列,存储空间上占用更多,同时 MySQL 还需要对它特殊处理。
在MySQL中,选择正确的数据类型,对于性能至关重要。一般应该遵循下面两步:(1)确定合适的大类型:数字、字符串、时间、二进制;(2)确定具体的类型:有无符号、取值范围、变长定长等。
在数据类型设置方面,尽量用更小的数据类型,因为它们通常有更好的性能,花费更少的硬件资源。并且,尽量把字段定义为NOT NULL
,避免使用
。NULL
1 数值类型
1.1 说明
类型 | 大小 | 范围(有符号) | 范围(无符号) | 用途 |
---|---|---|---|---|
TINYINT | 1 字节 | (-128, 127) | (0, 255) | 小整数值 |
SMALLINT | 2 字节 | (-32 768, 32 767) | (0, 65 535) | 大整数值 |
MEDIUMINT | 3 字节 | (-8 388 608, 8 388 607) | (0, 16 777 215) | 大整数值 |
INT或INTEGER | 4 字节 | (-2 147 483 648, 2 147 483 647) | (0, 4 294 967 295) | 大整数值 |
BIGINT | 8 字节 | (-9 233 372 036 854 775 808, 9 223 372 036 854 775 807) | (0, 18 446 744 073 709 551 615) | 极大整数值 |
FLOAT | 4 字节 | (-3.402 823 466 E+38, 1.175 494 351 E-38),0,(1.175 494 351 E-38,3.402 823 466 351 E+38) | 0, (1.175 494 351 E-38, 3.402 823 466 E+38) | 单精度 浮点数值 |
DOUBLE | 8 字节 | (1.797 693 134 862 315 7 E+308, 2.225 073 858 507 201 4 E-308), 0, (2.225 073 858 507 201 4 E-308, 1.797 693 134 862 315 7 E+308) | 0, (2.225 073 858 507 201 4 E-308, 1.797 693 134 862 315 7 E+308) | 双精度 浮点数值 |
DECIMAL | 对DECIMAL(M,D) ,如果M>D,为M+2否则为D+2 | 依赖于M和D的值 | 依赖于M和D的值 | 小数值 |
1.2 优化建议
- 如果整形数据没有负数,如ID号,建议指定为
UNSIGNED
无符号类型,容量可以扩大一倍。 - 建议使用
TINYINT
代替ENUM
、BITENUM
、SET
。 - 避免使用整数的显示宽度,也就是说,不要用
INT(10)
类似的方法指定字段显示宽度,直接用INT
。关于INT显示宽度。 - 用
INT UNSIGNED
来存储IPv4地址,用VARBINARY
来存储IPv6地址,当然存储之前需要用PHP函数转换。 DECIMAL
最适合保存准确度要求高,而且用于计算的数据,比如价格。但是在使用DECIMAL
类型的时候,注意长度设置。- 建议使用整形类型来运算和存储实数,方法是,实数乘以相应的倍数后再操作。
- 整数通常是最佳的数据类型,因为它速度快,并且能使用
AUTO_INCREMENT
。
2 日期和时间
2.1 说明
类型 | 大小 (字节) |
范围 | 格式 | 用途 |
---|---|---|---|---|
DATE | 3 | 1000-01-01 到 9999-12-31 | YYYY-MM-DD | 日期值 |
TIME | 3 | '-838:59:59' 到 '838:59:59' | HH:MM:SS | 时间值或持续时间 |
YEAR | 1 | 1901 到 2155 | YYYY | 年份值 |
DATETIME | 8 | 1000-01-01 00:00:00 到 9999-12-31 23:59:59 | YYYY-MM-DD HH:MM:SS | 混合日期和时间值 |
TIMESTAMP | 8 | 1970-01-01 00:00:00 到 2037 年某时 | YYYYMMDDhhmmss | 混合日期和时间值,时间戳 |
2.2 优化建议
- MySQL能存储的最小时间粒度为秒。
- 建议用
DATE
数据类型来保存日期。MySQL中默认的日期格式是yyyy-mm-dd
。 - 用MySQL的内建类型
DATE
、TIME
、DATETIME
来存储时间,而不是使用字符串。 - 当数据格式为
TIMESTAMP
和DATETIME
时,可以用CURRENT_TIMESTAMP
作为默认(MySQL5.6以后),MySQL会自动返回记录插入的确切时间。 TIMESTAMP
是UTC时间戳,与时区相关。DATETIME
的存储格式是一个YYYYMMDD HH:MM:SS
的整数,与时区无关,你存了什么,读出来就是什么。- 除非有特殊需求,否则建议使用
TIMESTAMP
,它比DATETIME
更节约空间。 - 有时人们把Unix的时间戳保存为整数值,但是这通常没有任何好处,这种格式处理起来不太方便,我们并不推荐它。
3 字符串
3.1 说明
类型 | 大小 | 用途 |
---|---|---|
CHAR | 0-255字节 | 定长字符串 |
VARCHAR | 0-65535 字节 | 变长字符串 |
TINYBLOB | 0-255字节 | 不超过 255 个字符的二进制字符串 |
TINYTEXT | 0-255字节 | 短文本字符串 |
BLOB | 0-65 535字节 | 二进制形式的长文本数据 |
TEXT | 0-65 535字节 | 长文本数据 |
MEDIUMBLOB | 0-16 777 215字节 | 二进制形式的中等长度文本数据 |
MEDIUMTEXT | 0-16 777 215字节 | 中等长度文本数据 |
LONGBLOB | 0-4 294 967 295字节 | 二进制形式的极大文本数据 |
LONGTEXT | 0-4 294 967 295字节 | 极大文本数据 |
3.2 优化建议
- 字符串的长度相差较大用
VARCHAR
;字符串短,且所有值都接近一个长度用CHAR
。 CHAR
和VARCHAR
适用于包括人名、邮政编码、电话号码和不超过255个字符长度的任意字母数字组合。那些要用来计算的数字不要用VARCHAR
类型保存,因为可能会导致一些与计算相关的问题。换句话说,可能影响到计算的准确性和完整性。BINARY
和VARBINARY
存储的是二进制字符串,与字符集无关。BLOB
系列存储二进制字符串,与字符集无关。TEXT
系列存储非二进制字符串,与字符集相关。一般情况下,你可以认为BLOB
是一个更大的VARBINARY
;TEXT
是一个更大的VARCHAR
。BLOB
和TEXT
都不能有默认值。
4 INT显示宽度
我们经常会使用命令来创建数据表,而且同时会指定一个长度,如下。但是,这里的长度并非是TINYINT
类型存储的最大长度,而是显示的最大长度。
CREATE TABLE `user`(
`id` TINYINT(2) UNSIGNED
);
这里表示user表的id字段的类型是TINYINT
,可以存储的最大数值是255
。所以,
在存储数据时,如果存入值小于等于255
,如200
,虽然超过2位,但是没有超出TINYINT
类型长度,所以可以正常保存;如果存入值大于255
,如500
,那么MySQL会自动保存为TINYINT
类型的最大值255
。
在查询数据时,不管查询结果为何值,都按实际输出。这里TINYINT(2)
中2
的作用就是,当需要在查询结果前填充0
时,命令中加上ZEROFILL
就可以实现,如:
`id` TINYINT(2) UNSIGNED ZEROFILL
这样,查询结果如果是5
,那输出就是05
。如果指定TINYINT(5)
,那输出就是00005
,其实实际存储的值还是5
,而且存储的数据不会超过255
,只是MySQL输出数据时在前面填充了0
。
换句话说,在MySQL命令中,字段的类型长度TINYINT(2)
、INT(11)
不会影响数据的插入,只会在使用ZEROFILL
时有用,让查询结果前填充0
。