百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

MySQL 高频面试题—索引

csdh11 2024-11-30 19:56 4 浏览

前言

谈到索引大家并不陌生,其目的就是为了提高查询效率,用一句话概括就是排好序的数据结构,MySQL中索引主要通过B+tree 实现,对B+tree感兴趣的可以看我上一篇文章。为了对索引有更深层次的了解,下面从以下几个方面介绍索引。

一、索引的分类

1.从存储结构上划分为:BTree索引(BTree或B+Tree索引)、Hash索引、全文索引、空间数据索引,其中B+Tree索引是我们最常用到的。

2.从应用层面分为:普通索引,唯一索引,主键索引,复合索引。

  • 普通索引:建立在普通字段上,没有任何限制;
  • 唯一索引:与“普通索引”相似,不同的是索引字段必须是唯一的,允许有空值;
  • 主键索引:主键索引是特殊的唯一索引,建立在主键字段上,不允许有空值存在;
  • 复合索引:又称组合索引,由多个字段组合建立的索引,复合索引可以代替多个单列索引,相比多个单列索引复合索引所需的开销更小;

3.从存储结构和查询逻辑方面划分:聚集索引,非聚集索引

二、聚集索引和非聚集索引

在 MySQL 数据库中 InnoDB 存储引擎,B+ 树可分为聚集索引和非聚集索引。聚集索引也叫聚簇索引,非聚集索引也叫辅助索引或者二级索引。
建表的时候都会创建一个聚集索引,每张表都有唯一的聚集索引,:

  • 如果主键被定义了,那么这个主键就是作为聚集索引
  • 如果没有主键被定义,那么该表的第一个唯一非空索引作为聚集索引
  • 如果没有主键也没有唯一索引,InnoDB 内部会生成一个隐藏的主键作为聚集索引

二者区别

  1. 聚集索引一张表只能有一个,而非聚集索引一张表可以存在多个;
  2. 聚集索引:索引排序与数据物理顺序一致,具有更快的检索速度,但是新增删除数据会比较慢,需要花费额外的时间进行重新排序来保证与数据物理顺序一致;
  3. 非聚集索引:物理存储不按照索引排序;非聚集索引则就是普通索引了,仅仅只是对数据列创建相应的索引,不影响整个表的物理存储顺序;
  4. 聚集索引叶子节点存储的是整行的数据,非聚集索引叶子节点存储的是主键的值;

三、什么是回表?

了解了聚集索引和非聚集索引,什么是MySQL回表也就不难理解了。假设通过聚集索引来查询数据,例如 select * from tb_name where id=10; 那么只需要搜索其叶子节点就可以找到id等于“10”这行数据。如果是通过非聚集索引来查询数据,例如 select * from tb_name where name='javaboy',那么此时需要先搜索 username 这一列的索引的 B+Tree,搜索完成后得到主键的值,然后再去搜索主键索引的 B+Tree,就可以获取到一行完整的数据。

上述先通过非聚集索引找到主键值,再通过主键去聚集索引查询记录的过程,称为回表查询

四、什么是覆盖索引?

辅助索引查找记录时,索引字段列已经覆盖了查询结果的列,就不需要再通过聚集索引查询完整的记录,这种情况就叫覆盖索引。

举个例子:建立辅助索引 index(name, age),当执行如下SQL:select name, age form t where name = 'zhangsan' and age = '25'; 于索引的节点上保存的索引列的组合name和age, 也就不需要再进行回表查询了。

这也是为什么不建议用select *查询的原因,只返回查询需要的列,当索引字段覆盖了查询需要的列时,也就不需要回表了,可以减少大量io操作提高查询速度。

五、索引在什么情况下失效?

熟悉explain关键字的都知道索引并不是时时都会生效的,比如以下几种情况,将导致索引失效:

  • 查询条件中带有or,除非所有的查询条件都建有索引,否则索引失效;
  • like查询是以%开头;
  • 索引字段使用了函数或者计算;
  • 发生了类型转换;例如:select * from t where no = 20; 当 no类型是字符类型,等号右边为int类型时,执行时会发生隐式类型转换,从而导致索引失效;
  • 不满足最左匹配原则;

最左匹配原则

最左匹配原则又称最左前缀原则,指的是在一个组合索引中(a,b,c),B+ 树会按照从左往右的顺序建立搜索树,B+ 树会优先比较 a,如果 a 相同在依次比较 b 和 c,但是像查询(b,c)这样的数据没有 a 字段,B+树就不知道从哪个结点查起了, 因为搜索树的第一个比较因子就是 a

总结:

由此可见,索引用的好能大大提高查询速度,前提是对索引有足够的了解,否者反而会SQL执行速度,当然索引并不是越多越好,还要根据具体的业务场景来选择,索引适合建立在离散度高的列,也就是重复数据较少的列,像性别只有男和女的列就不适合建立索引。

相关推荐

Micheal Nielsen's神经网络学习之二

依然是跟着MichaelNielsen的神经网络学习,基于前一篇的学习,已经大概明白了神经网络的基本结构和BP算法,也能通过神经网络训练数字识别功能,之后我试验了一下使用神经网络训练之前的文本分类,...

CocoaPods + XCTest进行单元测试 c单元测试工具

在使用XCTest进行单元测试时,我们经常会遇到一些CocoaPods中的开源框架的调用,比如“Realm”或“Alamofire”在测试的时候,如果配置不当,会导致“frameworknotfo...

Java基础知识回顾第四篇 java基础讲解

1、&和&&的区别作为逻辑运算符:&(不管左边是什么,右边都参与运算),&&(如果左边为false,右边则不参与运算,短路)另外&可作为位运算符...

项目中的流程及类似业务的设计模式总结

说到业务流程,可能是我做过的项目中涉及业务最多的一个方面了。除了在流程设计之外,在一些考核系统、产业审批、还有很多地方,都用到相似的设计思路,在此一并总结一下。再说到模式,并不是因为流行才用这个词,而...

联想三款显示器首批获得 Eyesafe Certified 2.0 认证

IT之家7月31日消息,据外媒报道,三款全新联想显示器是全球首批满足EyesafeCertified2.0的设备。据报道,联想获得EyesafeCertified2.0认证的显...

maven的生命周期,插件介绍(二) 一个典型的maven构建生命周期

1.maven生命周期一个完整的项目构建过程通常包括清理、编译、测试、打包、集成测试、验证、部署等步骤,Maven从中抽取了一套完善的、易扩展的生命周期。Maven的生命周期是抽象的,其中的具体任务都...

多线程(3)-基于Object的线程等待与唤醒

概述在使用synchronized进行线程同步中介绍了依赖对象锁定线程,本篇文章介绍如何依赖对象协调线程。同synchronized悲观锁一样,线程本身不能等待与唤醒,也是需要对象才能完成等待与唤醒的...

jquery mobile + 百度地图 + phonegap 写的一个"校园助手"的app

1jquerymobile+百度地图+phonegap写的一个"校园助手"的app,使用的是基于Flat-UI的jQueryMobile,请参考:https://github.com/...

Apache 服务启动不了 apache系统服务启动不了

{我是新手,从未遇到此问题,请各位大大勿喷}事由:今天早上上班突然发现公司网站出现问题。经过排查,发现是Apache出现问题。首先检查配置文件没有出问题后,启动服务发现Apache服务能启动,但是没法...

健康债和技术债都不能欠 公众号: 我是攻城师(woshigcs)

在Solr4.4之后,Solr提供了SolrCloud分布式集群的模式,它带来的主要好处是:(1)大数据量下更高的性能(2)更好扩展性(3)更高的可靠性(4)更简单易用什么时候应该使用Sol...

Eye Experience怎么用?HTC告诉你 eyebeam怎么用

IT之家(www.ithome.com):EyeExperience怎么用?HTC告诉你HTC上周除了发布HTCDesireEYE自拍机和HTCRE管状运动相机之外,还发布了一系列新的智能手机...

Android系统应用隐藏和应用禁止卸载

1、应用隐藏与禁用Android设置中的应用管理器提供了一个功能,就是【应用停用】功能,这是针对某些系统应用的。当应用停用之后,应用的图标会被隐藏,但apk还是存在,不会删除,核心接口就是Packag...

计算机软件技术分享--赠人玫瑰,手遗余香

一、Netty介绍Netty是由JBOSS提供的一个java开源框架。Netty提供异步的、事件驱动的网络应用程序框架和工具,用以快速开发高性能、高可靠性的网络服务器和客户端程序。也就是说,Netty...

Gecco爬虫框架的线程和队列模型 爬虫通用框架

简述爬虫在抓取一个页面后一般有两个任务,一个是解析页面内容,一个是将需要继续抓取的url放入队列继续抓取。因此,当爬取的网页很多的情况下,待抓取url的管理也是爬虫框架需要解决的问题。本文主要说的是g...

一点感悟(一) 初识 初读感知的意思

时间过得很快,在IT业已从业了两年多。人这一辈子到底需要什么,在路边看着人来人往,大部分人脸上都是很匆忙。上海真是一个魔都,它有魅力,有底蕴,但是一个外地人在这里扎根置业,真的是举全家之力,还贷3...