百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

掌握mysql的这些操作,让你事半功倍

csdh11 2024-12-17 12:12 4 浏览

mysql 是日常的开发中常用的关系型数据库,除了 CRUD 之外的操作,mysql 也有很多有趣而且巧妙的操作,掌握这些技巧,可以在工作中得心应手、游刃有余。

在本文中会涉及以下内容:

  • 1 mysql 字符串的操作,例如如何使用 concat 拼接更新语句以及 group_concat 的神奇用法。
  • 2 mysqlselect 的神奇用法, select 不仅可以用来执行 DQL,还可以用来查询变量和数学运算。
  • 3 mysql 多列查询配合联合索引的正确用法, 比如 in 的多列查询操作。
  • 4 涉及时间操作的一些函数和常用写法。
  • 5 索引的创建和使用高阶用法,例如如何在 text 类型的字段上创建索引、如何强制使用索引等操作。
  • 6 数据库的一些运维函数,查询数据库信息、引擎、表结构、索引、系统变量的常用函数。


前言

在项目开发中相信大多数人都与 mysql 数据库打过交道,对于各种业务场景的数据库操作,都可以八仙过海各显神通。本 chat 另辟蹊径,从日常的数据维护和修复场景出发,展现出在 mysql 不常用,但是很有效且提升操作效率的方法。

本 chat 中的数据操作采用如下表进行展示:

CREATE TABLE `tb_user` (
  `id` int(11) NOT NULL AUTO_INCREMENT COMMENT '主键',
  `name` varchar(255) DEFAULT NULL COMMENT '用户名称',
  `age` int(11) DEFAULT NULL COMMENT '年龄',
  `address` varchar(255) DEFAULT NULL COMMENT '地址',
  `brief` text COMMENT '个人简介',
  `update_time` datetime DEFAULT NULL ON UPDATE CURRENT_TIMESTAMP COMMENT '更新时间',
  `create_time` datetime DEFAULT NULL COMMENT '创建时间',
  `country` varchar(255) DEFAULT NULL COMMENT '国家',
  `id_card` varchar(18) DEFAULT NULL COMMENT '身份证号',
  `tag` varchar(20) DEFAULT NULL COMMENT '标签',
  `province` varchar(30) DEFAULT NULL COMMENT '省份',
  PRIMARY KEY (`id`),
  UNIQUE KEY `uk_tb_user_id_card` (`id_card`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=10008 DEFAULT CHARSET=utf8 COMMENT='用户信息表';

mysql 字符串相关操作

在介绍字符串操作之前,先提一个问题,一般情况下都会遇到修改线上数据的运维任务,此时大部分的手段就是提交 sql 变更。那么对于操作比较频繁的数据,比如账户信息表如果批量修改可能会造成表锁,导致服务不可用。此时就需要一条条的执行 sql 变更,那么如何快速拼写这些 sql 呢?大家思考一下自己常用的手段。

数据操作如下图所示:

第一个任务是将表中的年龄都加 1,这就用到了 mysql 字符串拼接函数 concat, 虽然这个不是最神奇的一个,但是确实是我工作中最常用到的一个。这里就直接给出答案:

# 这里使用了 concat 拼接函数
select concat("update tb_user set age = age + 1", " where id = ", id,";"  ) from tb_user;

执行后的结果如下图所示:

这里提一个稍微复杂的情况,将简介内容添加前缀 "个人简介:", address 修改为 address 和 conuntry 两个字段的拼接结果,其执行 sql 如下所示:

# 执行
select concat("update tb_user set brief = concat('","个人简介:' ,brief), address = concat( country , address)", " where id = ", id,";"  ) from tb_user where id > 10003;

如图所示为最终的执行结果:

字符串拼接concat和concat_ws

关于 concat 的使用方法,已经如前所示,还有一个类似的方法 concat_ws, concat(s1,s2) 等价于concat_ws("",s1,s2)

# concat_ws 即 concat width speator
select concat_ws("-","s1","s2")

展示结果如下图所示:

字符串field方法

field(s,s1,s2...) 返回第一个字符串 s 在字符串列表(s1,s2...)中的位置。

乍一看这个方法没有什么用途,但这里提一个问题,如果查询结果要根据状态进行排序,排列顺序为 2 1 3 5 4 ,这个要怎么实现呢? 这就用到了 field 方法,因为返回的是字符串的下标那么实现起来就容易了:

select * from tb_user order by field(s,s1,s2...)

示例操作如下图,可以看出来确实是按照排列顺序进行了数据展示

字符串长度方法

length()、char_length() 和 character_length() 都是返回字符数, length() 是按照字节来统计的, 而后两者是根据字符来统计的,对于采用UTF-8 编码的中文来说,一个中文就是 3 个字节。 三者之间的区别如下图所示:

字符串分组拼接

字符串分组拼接,这里说的就是 group_concat 方法,就是根据排序字段进行分组后,将组内的某列字段进行拼接。比如根据用户角色进行分组,展示用户角色下的所有权限。

# 1 mysql 分组的默认拼接符为逗号
select tag, group_concat(name) from tb_user group by tag;

执行结果如下图所示:

# 2 按照id 排序然后使用 - 进行拼接
select tag, group_concat(name order by id desc separator "-") from tb_user group by tag;

执行结果如下图所示:

# 3 使用 group_concat 来拼接 name 字段
select tag, concat("\"",group_concat(name order by id desc separator "\",\""),"\"") from tb_user group by tag;

执行结果如下图所示:

# 4 将 id 在 10000 和 30000 之间的数据进行拼接
select group_concat(id) from tb_user where id > 10000 and id < 30000;

执行结果如下图所示:

· 的用法在于分组,如果没有分组的话也是可以使用的。如果有某些后台的接口,需要根据 id 来修复数据,传入的参数一般都是 · 结构,这个时候直接在 · 平台上拼接好 id 参数,直接执行即可,省去了拼接的操作,如果是字符串类型的则参考第 3 条来执行。这里需要注意的是,拼接的长度是有限制的,超过长度的部分不会展示出来。

字符串的其它操作

  • 1 字符串倒序的方法。例如 select reverse("abcdef"),执行的结果就是字符串倒序。
  • 2 字符串去空格 trim(s), 顾名思义就是去除字符串左右两边的空字符串,对应的还有 ltrim 和 rtrim,分别是去除左边和右边的空格。
  • 3 字符串复制,select repeat('12',3) 即将字符串进行复制几遍,示例的结果就是 121212。
  • 4 字符串的截取。substr("abcdef", 1, 3),从 1 开始截取长度为 3 的字符串。
  • 5 字符串比较,strcmp("111","222") 相等返回 0, 否则根据返回 1 或者 -1 ,这个和 java 字符串比较的结果是类似的。
  • 5 字符串大小写转换。 ucase(s) 和 upper(s) 都是将字符串转为大写,lcase(s) 和 lower(s) 都是将字符串转为小写。

列举了这么多,还以为 mysql 只是一个数据库那么简单吗,mysql 的知识分为两个部分,一部分是数据的存储,而另一部分则是 sql 语法,sql 其实是和 java 、python 一样的,也是一门开发语言。

数字的操作

关于数字的操作,除了在开发中常用的聚合方法, sum, max ,min, avg 之外,还有字符串的格式化展示,四舍五入的操作。具体的函数方法如下所示:

# format(x,n) 格式化数字并四舍五入保留相应的位数,形式为 "#,###.##"
# 格式化两位后的数字为 12,45.35
select format(12345.345,2)
# round(x,n) 四舍五入保留小数
# 四舍五入后为 12345.35
select round(12345.345,2)
# 数字格式化,不会进行四舍五入
truncate(x,n)
# 指数运算
pow(x,y)
# 数据取整操作
floor(1.3) 向下取整取值,结果为1
ceiling(1.3) 向上取整取值,结果为2

mysql 时间和日期操作

对于日期的操作,也是经常使用的,比如获取当前的时间为 select now()。

# 格式化数据时间 date_format(d,f)
select date_format('2022-02-22 11:11:11','%Y-%m-%d')
 2022-02-22
# 返回连个时间之间的相隔天数
datediff(d1,d2)
# date_add/date_sub 函数从日期减去、加上指定的时间间隔
# 其基本的表达式为 date_sub(date, interval expr type)
# 其下两个方法的含义是查询2天前的日期和3天后的日期
select date_sub(now(),interval 2 day)
select date_add(now(),interval 3 day)
# 日期部分的操作,分表获取小时数、天数、月份、年份和季度数据
hour(date)
day(date)
month(date)
year(date)
quarter(date)
# 一周的中周几,从周日开始算一周的第一天
dayofweek(date)
# 日期为当年的第几周
week(date)

select 的用法

select 在日常的工作开发中大家只是用来查询表数据的结果,但是小编想说的是,select 可不仅仅是这样一个单调的用途。

select 可以用来查询函数的运算结果,这个在前文中已多次使用,比如 select reverse("abcdef");除此之外,select 还可以用来四则运算,比如 select 1 + 2 。

# if 判断操作,age 大于 15个返回 address,其他的返回 country,这里在查询数据时需要简单的逻辑判断时可以使用
select if(age > 15, address , country ) as 'result' from tb_user
# 如果结果为null,给出计算的默认值
select ifnull(sum(age),0) from tb_user

执行结果如图:

多列 in 查询

在日常的开发工作中,在查询数据时通常会遇到这样的情况,根据并列的两个或者多个条件查询多条数据,以前文讲述的数据表为例:

# 根据标签和省份批量查询数据,查询条件如下所示:
tag = "学生" and province = "北京"
tag = "教师" and province = "湖南"

最终实现的sql 语句如下所示:
select * from tb_user where (tag,province) in
(
("学生","北京"),
("教师","湖南")
)

执行结果如图所示,满足查询要求:

当然多列的查询也可以使用 (tag = "学生" and province = "北京") or (tag = "教师" and province = "湖南") 的方式来实现,但是这样的拼接不如上图展示的优雅,而且这个样多列 in 查询也是可以使用索引的,不会影响查询数据的效率。

数据先查询再操作

在日常的开发任务中,经常会遇到这样的情况,要往数据库中插入数据,为了避免重复的插入,会根据某些唯一键先去数据库中查询,然后根据返回的结果判断是更新、忽略还是删除后插入。我们通常是按照两个步骤或者三个步骤来操作的,这里给大家说一下,其实这些需求可以根据一条 sql 搞定的。

  • 1 数据存在则忽略更新。insert ignore into,如果插入的数据会导致 unique 索引或 primary key 发生冲突,则忽略此次操作不会插入数据。
  • 2 数据存在则删除旧数据插入新数据。replace into 如果插入的数据会导致 unique 索引或 primary key 发生冲突,则先删除旧数据再插入最新的数据。
  • 3 数据存在则更新数据。on duplicate key update 如果插入的数据会导致 unique 索引或 primary key 发生冲突,则执行执行更新操作。这样的操作在插入和更新数据时都可以使用。
# 其格式如下图所示,分别是忽略更新/删除后重新插入/重复更新的 sql 模板
insert ignore intao table_name ...
replace intao table_name ...
insert into table ... on duplicate key update fieldd1  = value1,fieldd2  = value2

索引的一些技巧

在数据库查询中,经常会使用到索引,但是对于大字段如何创建索引呢,这是一个问题。

在实践中,可以使用全文索引来提高查询效率,常用的索引有 normal / unique/ fulltext 等,但是如果使用 mysql 全文索引还不如使用 ES 来的更快速一些,这样的话就引出了对大字段加索引的方法,不需要全部都加这样会比较占用空间,字需要加一部分的索引长度即可,

# 对 address 字段建立索引,并且只对前100的长度建索引
alter table tb_user add index `uk_tb_user_address`(`address`(100)) using btree;

这个是一种方法,对于 url 类型的字段十分有效,因为 url 只有后半部分的区分比较大,所以在存储和查询时对内容进行倒序排列,这样区分度大的就在字段前面,其区分度大大增加。

另外在查询数据时,对于使用索引,可以使用 force index 的当时强制使用某个索引,以提高索引效率,这个是在优化环节 mysql 使用索引错误的情况下经人工介入才可以使用。其使用方法为:

# 强制使用 uk_tb_user_id_card 索引时使用了全表扫描, type = all
explain select * from tb_user force index(uk_tb_user_id_card) where id = "10000"
# 默认情况下的执行计划使用了主键索引,type = const
explain select * from tb_user  where id = "10000";

以上只是强制使用索引,在正常的 sql 查询中,mysql 会基于成本和时间优化选择合适的索引,在复杂的情况下如果需要强制走某个索引可以采用该方法。

mysql 的一些其它操作

以下是常见的数据库操作命令,在日常的运维过程中有着重要的作用,大家有时间可以实操一下,命令也比较简单,就不展示查询的结果了。

# 查询数据库名称
select database()
# 查询数据库的版本信息
select version()
# 展示数据 innodb 的引擎信息
show variables like "%innodb%"
# 展示数据库中的表信息
show table like "tb_%"
# 展示数据库中的表结构信息
desc table_name
# 展示数据库表的创建信息 ddl 语句
show create table tb_user
# 查询当前数据库状态
show status

这里重点说一下 show processlist 命令,这个命令能够查询当前数据库的连接信息,类似于在 linux 中查看正在运行的进程,那么既然可以查到对应的进程,那么就可以杀死对应的进程,这在数据库死锁或者故障慢查询中可以使用,但仅限于开发和测试环境,线上环境还是要慎重的。 查询命令如下图所示,如果要杀死进程,使用 kill Id 号即可。

Id 进程号
User 连接数据库的用户
Host 对方的地址信息
db 使用的数据库信息
Command sleep 代表休眠,Query 表示进行中
Time 这个要和Commnad 结合来看,时间长的一般情况下就是异常
State 当前的任务状态
Info 执行的sql 信息

总结

在本 chat 中,从日常工作中常用的操作出发,采用问题的方式递进延伸 mysql 的知识点,从简单查询到巧妙的函数操作,一切的目的都是为了减轻工作量,提高查询的效率。特别是 concat 和 group_concat 函数,还有数字和日期的操作,以及最后的 in 多列查询,最值得回顾的是数据先查询再操作的三种方式,从 sql 层面减轻了工作量。

相关推荐

Micheal Nielsen&#39;s神经网络学习之二

依然是跟着MichaelNielsen的神经网络学习,基于前一篇的学习,已经大概明白了神经网络的基本结构和BP算法,也能通过神经网络训练数字识别功能,之后我试验了一下使用神经网络训练之前的文本分类,...

CocoaPods + XCTest进行单元测试 c单元测试工具

在使用XCTest进行单元测试时,我们经常会遇到一些CocoaPods中的开源框架的调用,比如“Realm”或“Alamofire”在测试的时候,如果配置不当,会导致“frameworknotfo...

Java基础知识回顾第四篇 java基础讲解

1、&和&&的区别作为逻辑运算符:&(不管左边是什么,右边都参与运算),&&(如果左边为false,右边则不参与运算,短路)另外&可作为位运算符...

项目中的流程及类似业务的设计模式总结

说到业务流程,可能是我做过的项目中涉及业务最多的一个方面了。除了在流程设计之外,在一些考核系统、产业审批、还有很多地方,都用到相似的设计思路,在此一并总结一下。再说到模式,并不是因为流行才用这个词,而...

联想三款显示器首批获得 Eyesafe Certified 2.0 认证

IT之家7月31日消息,据外媒报道,三款全新联想显示器是全球首批满足EyesafeCertified2.0的设备。据报道,联想获得EyesafeCertified2.0认证的显...

maven的生命周期,插件介绍(二) 一个典型的maven构建生命周期

1.maven生命周期一个完整的项目构建过程通常包括清理、编译、测试、打包、集成测试、验证、部署等步骤,Maven从中抽取了一套完善的、易扩展的生命周期。Maven的生命周期是抽象的,其中的具体任务都...

多线程(3)-基于Object的线程等待与唤醒

概述在使用synchronized进行线程同步中介绍了依赖对象锁定线程,本篇文章介绍如何依赖对象协调线程。同synchronized悲观锁一样,线程本身不能等待与唤醒,也是需要对象才能完成等待与唤醒的...

jquery mobile + 百度地图 + phonegap 写的一个&quot;校园助手&quot;的app

1jquerymobile+百度地图+phonegap写的一个"校园助手"的app,使用的是基于Flat-UI的jQueryMobile,请参考:https://github.com/...

Apache 服务启动不了 apache系统服务启动不了

{我是新手,从未遇到此问题,请各位大大勿喷}事由:今天早上上班突然发现公司网站出现问题。经过排查,发现是Apache出现问题。首先检查配置文件没有出问题后,启动服务发现Apache服务能启动,但是没法...

健康债和技术债都不能欠 公众号: 我是攻城师(woshigcs)

在Solr4.4之后,Solr提供了SolrCloud分布式集群的模式,它带来的主要好处是:(1)大数据量下更高的性能(2)更好扩展性(3)更高的可靠性(4)更简单易用什么时候应该使用Sol...

Eye Experience怎么用?HTC告诉你 eyebeam怎么用

IT之家(www.ithome.com):EyeExperience怎么用?HTC告诉你HTC上周除了发布HTCDesireEYE自拍机和HTCRE管状运动相机之外,还发布了一系列新的智能手机...

Android系统应用隐藏和应用禁止卸载

1、应用隐藏与禁用Android设置中的应用管理器提供了一个功能,就是【应用停用】功能,这是针对某些系统应用的。当应用停用之后,应用的图标会被隐藏,但apk还是存在,不会删除,核心接口就是Packag...

计算机软件技术分享--赠人玫瑰,手遗余香

一、Netty介绍Netty是由JBOSS提供的一个java开源框架。Netty提供异步的、事件驱动的网络应用程序框架和工具,用以快速开发高性能、高可靠性的网络服务器和客户端程序。也就是说,Netty...

Gecco爬虫框架的线程和队列模型 爬虫通用框架

简述爬虫在抓取一个页面后一般有两个任务,一个是解析页面内容,一个是将需要继续抓取的url放入队列继续抓取。因此,当爬取的网页很多的情况下,待抓取url的管理也是爬虫框架需要解决的问题。本文主要说的是g...

一点感悟(一) 初识 初读感知的意思

时间过得很快,在IT业已从业了两年多。人这一辈子到底需要什么,在路边看着人来人往,大部分人脸上都是很匆忙。上海真是一个魔都,它有魅力,有底蕴,但是一个外地人在这里扎根置业,真的是举全家之力,还贷3...