【mysql】普通索引和组合索引(复合索引、联合索引) & 最左原则
文章目录概述普通索引唯一索引主键索引组合索引最左前缀概述索引分单列索引和组合索引:单列索引,即一个索引只包含单个列,一个表可以有多个单列索引,但这不是组合索引;组合索引(也叫复合索引),即一个索引包含多个列。普通索引普通索引是最基本的索引,它没有任何限制创建索引CREATE INDEX indexName ON mytable(username(length));如果是 CHAR,VARCHAR类
概述
索引分单列索引和组合索引:
-
单列索引,即
一个索引只包含单个列
,一个表可以有多个单列索引,但这不是组合索引; -
组合索引(也叫复合索引、
联合索引
),即一个索引包含多个列
。
普通索引
普通索引是最基本的索引,它没有任何限制
- 创建索引
CREATE INDEX indexName ON mytable(username(length));
如果是 CHAR,VARCHAR类型,length可以小于字段实际长度;如果是BLOB和TEXT类型,必须指定 length,下同。
- 修改表结构
ALTER mytable ADD INDEX [indexName] ON (username(length))
- 创建表的时候直接指定
CREATE TABLE mytable(
ID INT NOT NULL,
username VARCHAR(16) NOT NULL,
INDEX [indexName] (username(length))
);
- 删除索引的语法:
DROP INDEX [indexName] ON mytable;
唯一索引
唯一索引与普通索引类似,不同的就是:索引列的值必须唯一,但允许有空值
。
如果是组合索引,则列值的组合必须唯一。
它有以下几种创建方式:
- 创建索引
CREATE UNIQUE INDEX indexName ON mytable(username(length))
- 修改表结构
ALTER mytable ADD UNIQUE [indexName] ON (username(length))
- 创建表的时候直接指定
CREATE TABLE mytable(
ID INT NOT NULL,
username VARCHAR(16) NOT NULL,
UNIQUE[indexName] (username(length))
);
主键索引
主键索引是一种特殊的唯一索引
,不允许有空值
。一般是在建表的时候同时创建主键索引:
CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL, PRIMARY KEY(ID) );
当然也可以用 ALTER 命令。记住:一个表只能有一个主键
。
组合索引
为了形象地对比单列索引和组合索引,为表添加多个字段:
CREATE TABLE mytable (
ID INT NOT NULL,
username VARCHAR (16) NOT NULL,
city VARCHAR (50) NOT NULL,
age INT NOT NULL
) ;
为了进一步榨取MySQL的效率,就要考虑建立组合索引。就是将 name, city, age建到一个索引里:
ALTER TABLE mytable ADD INDEX name_city_age (username(10),city,age);
建表时,usernname长度为 16,这里用 10。这是因为一般情况下名字的长度不会超过10,这样会加速索引查询速度,还会减少索引文件的大小,提高 INSERT的更新速度。
如果分别在 usernname,city,age上建立单列索引,让该表有3个单列索引,查询时和上述的组合索引效率也会大不一样,远远低于我们的组合索引
。虽然此时有了三个索引,但MySQL只能用到其中的那个它认为似乎是最有效率的单列索引。
建立这样的组合索引,其实是相当于分别建立了下面三组组合索引:
[ usernname,city,age] 、[ usernname,city]、[ usernname]
最左前缀
为什么没有 city,age这样的组合索引呢?这是因为MySQL组合索引“最左前缀
”的结果。
简单的理解就是只从最左面的开始组合。组合索引的第一个字段必须出现在查询组句中,并且不能跳跃
,这个索引才会被用到,因此并不是只要包含这三列的查询都会用到该组合索引,下面的几个SQL就会用到这个组合索引:
SELECT * FROM mytable WHREE username="admin" AND city="郑州"
SELECT * FROM mytable WHREE username="admin"
而下面几个则不会用到:
SELECT * FROM mytable WHREE age=20 AND city="郑州"
SELECT * FROM mytable WHREE city="郑州"
注意
索引的字段可以是任意顺序的
,如:
假设在test表有组合索引(col1,col2)
SELECT * FROM test WHERE col1=“1” AND clo2=“2”
SELECT * FROM test WHERE col2=“2” AND clo1=“1”
这两个查询语句都会用到索引
(col1,col2),mysql创建联合索引的规则是首先会对联合合索引的最左边的,也就是第一个字段col1的数据进行排序,在第一个字段的排序基础上,然后再对后面第二个字段col2进行排序。
为什么要使用联合索引
- 减少开销。
建一个联合索引(col1,col2,col3),实际相当于建了(col1),(col1,col2),(col1,col2,col3)三个索引。每多一个索引,都会增加写操作的开销和磁盘空间的开销。对于大量数据的表,使用联合索引会大大的减少开销! - 覆盖索引。
对联合索引(col1,col2,col3),如果有如下的sql:select col1,col2,col3 from test where col1=1 and col2=2
。那么MySQL可以直接通过遍历索引取得数据,而无需回表,这减少了很多的随机io操作。减少io操作,特别的随机io其实是dba主要的优化策略。所以,在真正的实际应用中,覆盖索引是主要的提升性能的优化手段之一。
简单来说,覆盖就是select后面的列都在索引中,这样就不需要继续扫描数据行了
-
效率高。
索引列越多,通过索引筛选出的数据越少。有1000W条数据的表,有如下sql:select from table where col1=1 and col2=2 and col3=3,假设假设每个条件可以筛选出10%的数据,如果只有单值索引,那么通过该索引能筛选出
1000W*10%=100w
条数据,然后再回表从100w条数据中找到符合col2=2 and col3= 3的数据,然后再排序,再分页;如果是联合索引,通过索引筛选出
1000w10% *10% *10%=1w
,效率提升可想而知!
参考:
《普通索引和组合索引》 参考主体
《组合索引的最左优先原则》 索引的字段可以是任意顺序
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)