MySQL数据库应用案例课堂
上QQ阅读APP看书,第一时间看更新

6.1 索引简介

索引是对数据库表中的一列或多列的值进行排序的一种结构,使用索引可提高数据库中特定数据的查询速度。本节将介绍索引的含义、分类和设计原则。

6.1.1 索引的含义和特点

索引是一个单独的、存储在磁盘上的数据库结构,包含对数据表里所有记录的引用指针。使用索引可以快速找出在某个或多个列中有一特定值的行,MySQL中的所有列类型都可以被索引,对相关列使用索引是提高查询操作速度的最佳途径。

例如,数据库中有2万条记录,现在要执行这样一个查询:SELECT * FROM table where num=10000。如果没有索引,必须遍历整个表,直到num等于10000的行被找到为止;如果在num列上创建索引,MySQL不需要任何扫描,直接在索引里面找10000,就可以得知这一行的位置。可见,索引的建立可以提高数据库的查询速度。

索引是在存储引擎中实现的,因此,每种存储引擎的索引都不一定完全相同,并且一种存储引擎也不一定支持所有的索引类型。应根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎都支持每个表至少16个索引,总索引长度至少为256字节。MySQL中索引的存储类型有两种:BTREE和HASH,其和表的存储引擎相关。MyISAM和InnoDB存储引擎只支持BTREE索引;MEMORY和HEAP存储引擎可以支持HASH和BTREE索引。

索引的优点主要有以下几条:

(1)通过创建唯一索引,可以保证数据库表中每一行数据的唯一性。

(2)可以大大加快数据的查询速度,这也是创建索引最主要的原因。

(3)在实现数据的参照完整性方面,可以加速表和表之间的连接。

(4)在使用分组和排序子句进行数据查询时,也可以显著减少查询中分组和排序的时间。

增加索引也有许多不利的方面,主要表现在如下几个方面:

(1)创建索引和维护索引要耗费时间,并且随着数据量的增加所耗费的时间也会增加。

(2)除了数据表要占数据空间之外,每一个索引还要占一定的物理空间,如果有大量的索引,索引可能会使数据文件更快达到最大文件尺寸。

(3)当对表中的数据进行增加、删除和修改的时候,索引也要动态地维护,这样就降低了数据的维护速度。

6.1.2 索引的分类

MySQL中的索引可以分为以下几类。

1.普通索引和唯一索引

普通索引是MySQL中的基本索引类型,允许在定义索引的列中插入重复值和空值。

唯一索引是指索引列的值必须唯一,但允许有空值。如果是组合索引,则列值的组合必须唯一。主键索引是一种特殊的唯一索引,不允许有空值。

2.单列索引和组合索引

单列索引是指索引只包含单个列,一个表可以有多个单列索引。

组合索引是指在表的多个字段组合上创建的索引,只有在查询条件中使用了这些字段中的左边字段时,索引才会被使用。使用组合索引时遵循最左前缀集合。

3.全文索引

全文索引的类型为FULLTEXT,在定义索引的列上支持值的全文查找,允许在这些索引列中插入重复值和空值。全文索引可以在CHAR、VARCHAR或者TEXT类型的列上创建。在MySQL中,只有MyISAM存储引擎支持全文索引。

4.空间索引

空间索引是对空间数据类型的字段建立的索引,MySQL中的空间数据类型有4种,分别是GEOMETRY、POINT、LINESTRING和POLYGON。在MySQL中使用SPATIAL关键字进行扩展,可以用创建正规索引类似的语法创建空间索引。创建空间索引的列,必须将其声明为NOT NULL,空间索引只能在存储引擎为MyISAM的表中创建。

6.1.3 索引的设计原则

索引设计不合理或者缺少索引都会影响数据库和应用程序的性能。高效的索引对于获得良好的性能非常重要。设计索引时,应该考虑以下准则:

(1)索引并非越多越好。一个表中如有大量的索引,不仅占用磁盘空间,而且会影响INSERT、DELETE、UPDATE等语句的性能,因为当更改表中的数据时,索引也要进行调整和更新。

(2)避免对经常更新的表进行过多的索引,并且索引中的列应尽可能少。而对经常用于查询的字段应该创建索引,但要避免添加不必要的字段。

(3)数据量小的表最好不要使用索引。由于数据较少,查询花费的时间可能比遍历索引的时间还要短,索引可能不会产生优化效果。

(4)在条件表达式中经常会用到的不同值较多的列上建立索引,在不同值少的列上不要建立索引。比如在学生表的“性别”字段上只有“男”与“女”两个不同值,因此就无须建立索引。在不同值少的列上建立索引不但不会提高查询效率,反而会严重降低更新速度。

(5)当唯一性是某种数据本身的特征时,指定唯一索引。使用唯一索引需能确保定义的列的数据完整性,以提高查询速度。

(6)在频繁进行排序或分组(即进行group by或order by操作)的列上建立索引,如果待排序的列有多个,可以在这些列上建立组合索引。