挽救数据库性能的30条黄金法则|原力计划

时间:2022-10-10 18:11:53 | 浏览:1321

作者 | geekguy责编 | 王晓曼出品 | CSDN博客1. 优化查询,应尽量避免全表扫描,应该在用于检索数据和排序数据的字段上建立索引,如where子句用于搜索,order by子句用于排序,所以在这两个子句涉及到的字段上需要建立索

作者 | geekguy

责编 | 王晓曼

出品 | CSDN博客

1. 优化查询,应尽量避免全表扫描,应该在用于检索数据和排序数据的字段上建立索引,如where子句用于搜索,order by子句用于排序,所以在这两个子句涉及到的字段上需要建立索引。

2. 应该尽量避免在where子句中使用否定的操作符,如不等于(!=或<>)、否则数据库引擎将放弃使用索引而进行全表扫描。

3. 在尽量避免在where子句中使用或(or)作为连接条件,否则数据库引擎将放弃使用索引而进行全表扫描。

如下面的SQL语句可能会带来性能问题:

select id,name,age from persons

where name = "Bill" or age > 30

由于这条SQL语句使用了or,所以数据库引擎会进行全表扫描,为了避免全表扫描,可以将这条SQL语句改成下面的形式。

select id,name,age from persons where name = "Bill"

union all

select id,name,age from persons where num = 20

4. 应该尽量避免在where子句中使用进行判断,否则数据库引擎将放弃使用索引而进行全表扫描。先看下面的SQL语句:

select id,name,age from persons where age is

为了避免使用,可以设置age字段的默认值为0,这样就可以通过下面的SQL语句达到同样的结果。

select id,name,age from persons where age = 0

5. 尽量不用使用like检索数据,因为也会导致数据库引擎将放弃使用索引而进行全表扫描。

例如,下面的SQL语句执行的效率会非常低:

select id,name,age from persons where name like "%John%"

如果真想进行模糊查询,可以使用全文检索。

6. 在where子句中应尽量避免在字段中使用表达式(包括函数运算、算数运算等),否则据库引擎将放弃使用索引而进行全表扫描。例如,下面的SQL语句执行的性能比较差:

select id,name,age from persons age / 2 > 12

应该利用表达式变换,改成下面的形式:

select id,name,age from persons age > 2 * 12

或者干脆改成下面的形式:

select id,name,age from persons age > 24

7. 应尽量避免使用in和not in,否则也会导致全表扫描。

如并不推荐下面的写法:

select id, name,age from persons where age in (22,23,24)

如果数值是连续的,应该使用between,而不要用in,如果数值是不连续的,可以分成多个SQL,用union all连接查询结果。

select id,name,age from persons where age between 22 and 24

select id,name,age from persons where age = 22

union all

select id,name,age from persons where age = 26

union all

select id,name,age from persons where age = 30

8. 应该尽量避免在where子句中使用参数,否则也将导致全表扫描。这是因为参数需要在SQL运行时才进行替换,而SQL优化(使用索引属于优化的一部分)是在编译时进行的。所以数据库引擎在检索到参数时,由于参数的具体值是未知的,所以也就无法优化了,当然也就无法使用索引了。

不使用索引的SQL语句:

select id,name,age from persons where name = @name

为了使用索引,可以改成下面强制使用索引的方式:

select id,name,age from persons with(index(name_index)) where name = @name

其中name_index是建立在name字段上的索引名。

9. 尽量不要执行一些没意义的查询,如条件完全为false的查询:

select id,name,age into persons1 from persons where age < 0

这样的代码会返回一个空结果集,而且会大量消耗系统资源,如果真的想建一个空表,应该直接用create table语句。

10.如果使用的索引是符合索引,只有使用该符合索引的第1个字段作为条件时才能保证数据库引擎使用该符合索引,否则该符合索引不会被使用。并且应该尽可能让字段顺序与索引顺序一致。例如,name_index是first_name和last_name字段的符合索引,使用下面的SQL语句会使用该索引。

select id,first_name,last_name

from persons

where first_name = "Bill"

11.如果非要在SQL语句中使用in,那么使用exists代替in是一个好主意:

select id,num from t where num in (select num from h)

应该用下面的SQL语句代替:

select id,num form twhere exists(select 0 from h where num = t.num)

12. 索引并不是在任何时候都有效,如果索引列有大量重复的数据,那么数据库引擎可能不会去利用索引。例如,SEX字段的值只有两种可能:male和female,可能这两个值各占一半,这样在SEX字段上建立索引就没有任何意义。

13.能使用数值型字段就使用数值型字段。因为比较数值型字段的效率要远比字符型字段的效率高,这是因为比较字符型的值,要一个字母一个字母地比较,而数值型的值,只是比较一个数。所以如果只包含数值信息的值,应该尽量使用数值类型的字段。例如,age、salary等。

14.应尽量避免使用固定长度的字段,如char、nchar。使用可变长度的字段是一个非常好的选择。因为可变长度字段占用的空间是按需分配的,所以占用空间比较少。对于查询来说,毫无疑问,当然是占用空间小的字段的查询效率更高了。

15.尽量按需返回字段和记录,例如:

select id,name,age from persons where age > 20

尽量如要使用“*”返回所有不需要的字段,也不需要一下就查询出所有的记录,如下面的SQL语句在数据量很大时查询效率是非常低的。

select * from persons

16. 索引有利有弊,增加索引,可以提高select的执行效率,但付出的代价是在进行insert和update操作时,可能会降低效率。因为进行insert和update操作时通常需要重建索引。所以在一个表中并不是索引越多越好。我的建议如下:

(1)如果一个表大多数时进行的是select操作,那么索引多一些大多数时候确实可以提升性能,但这有一个前提,就是不能频繁进行insert和update操作。

(2)一个表中的索引数不能太多,最好不要超过6个,否则就好考虑优化一下数据库了。

17.应尽可能的避免更新clustered 索引数据列,因为 clustered 索引数据列的顺序就是表记录的物理存储顺序,一旦该列值改变将导致整个表记录的顺序的调整,会耗费相当大的资源。若应用系统需要频繁更新 clustered 索引数据列,那么需要考虑是否应将该索引建为 clustered 索引。

18.应尽量避免向客户端返回大数据,如果数据量过大,应该改变一下需求,或采用分页返回的方式,如使用MySQL中的limit子句现在返回的数据。

19.尽量避免使用游标,因为游标的效率较差,如果游标操作的数据超过1万行,那么就应该采用其他方案。

20.使用基于游标的方法或临时表方法之前,应先寻找基于数据集的解决方案来解决问题,基于数据集的方法通常更有效。

21.如果使用到了临时表,在存储过程的最后务必将所有的临时表显式删除,先用 truncate table清除表中的数据 ,然后 用drop table彻底删除物理表,这样可以避免系统表的较长时间锁定。

22.避免频繁创建和删除临时表,以减少系统表资源的消耗。

23.在新建临时表时,如果一次性插入的数据量很大,那么可以使用 select into 代替 create table,避免造成大量 log ,以提高执行效率;如果数据量不大,为了缓和系统表的资源,应先createtable,然后使用insert插入数据。

24.在所有的存储过程和触发器的开始处设置 SET NOCOUNT ON ,在结束时设置 SET NOCOUNT OFF 。无需在执行存储过程和触发器的每个语句后向客户端发送 DONE_IN_PROC 消息。

25.尽量避免大事务操作,提高系统并发能力。

26.应尽量一次性插入多条数据,例如,使用下面的SQL语句性能会很低:

insert into persons(id,name,age) values("Bill",24)

insert into persons(id,name,age) values("Mike",26)

insert into persons(id,name,age) values("John",20)

为了提升性能,可以一次性插入这3条记录。

insert into persons(id,name,age) values("Bill",24),("Mike",26),("John",20)

27.如果不得不使用like进行模糊查询时,不要在关键字前面加%

反例:

select id,name,age from persons where name like "%abc%"

如果在关键字前面加%,那么查询是肯定要走全表查询的。

正例:

select id,name,age from persons where name like "abc%"

28.尽量用unionall代替union

union和union all的差异主要是前者需要将两个(或者多个)结果集合并后再进行唯一性过滤操作,这就会涉及到排序,增加大量的cpu运算,加大资源消耗及延迟。所以当我们可以确认不可能出现重复结果集或者不在乎重复结果集的时候,尽量使用union all而不是union。

29.尽量使用等值连接

等值连接就是inner join,也称为内联进,而left join和right join是外连接。

先看下面的SQL语句:

select a.id,a.name,b.id,b.name from a left join b on a.id = b.id

select a.id,a.name,b.id,b.name from a right join b on a.id = b.id

select a.id,a.name,b.id,b.name from a inner join b on a.id = b.id

上面的3条SQL语句,前两条分别使用了左连接和右连接,而最后一条使用了内连接,经过实际运行,使用内连接的SQL语句的执行效率明显优于左连接和右连接。所以在能满足需求的前提下,应该尽可能使用内连接(等值连接)。

30. 尽量用外连接来替换子查询。反例:

select id,name from a where exists (select id from b where id>=10 and a.product_id=b.product_id)

在上面的SQL语句中,数据库引擎会先对外表a执行全表查询,然后根据product_id逐个执行子查询,如果外层表(a表)中的数据非常多,查询性能会非常糟糕。所以应该将SQL语句改成下面的形式:

select id,name from a inner join b on A.product_id=b.product_id where b.id>=10

版权声明:本文为CSDN博主「geekguy」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

原文链接:

https://blog.csdn.net/nokiaguy/article/details/106330867

☞中国 AI 应用元年来了!

☞年仅 5 岁的 Rust 如何成为最受欢迎的编程语言?

☞15 岁黑进系统,发挑衅邮件意外获 Offer,不惑之年捐出全部财产,Twitter CEO 太牛了!

☞避坑!使用 Kubernetes 最易犯的 10 个错误

☞必读!53个Python经典面试题详解

☞赠书 | 1月以来 Tether 增发47亿 USDT,美元都去哪儿了?

相关资讯

助力数字广州,广州市白云区数据安全监测与运行中心揭牌

为推动广州市网络安全能力建设,助力白云数字化、智慧化发展,8月18日,广州市白云区数据安全监测与运行中心揭牌暨安恒信息广东总部落成仪式正式举办。据悉,白云区数据安全监测与运行中心由广州市白云区政务服务数据管理局组建,作为白云区政务网络安全和。

青岛第二批集中供地计划出炉 100宗地将于8月23日开始出让

新京报讯(记者 饶舒玮)近期,多城陆续披露第二批次集中供地公告。7月30日,继杭州后,青岛也发布第二批集中出让土地公告。青岛此次计划供应100宗地块,面积约5474亩,其中住宅用地(含商住用地)79宗,面积约4480亩。根据公告,青岛市第二

计划实施82个项目、投资484.82亿元!曲靖提升中心城区北片区功能

掌上曲靖讯(曲靖日报记者 刘成龙)近日,记者从曲靖市住房和城乡建设局获悉,曲靖市以项目为引领,把推进北片区功能提升项目建设作为做好“六稳”工作、落实“六保”任务、建设名副其实的云南副中心城市的重要抓手,扎实推进北片区建设发展,到2023年,

四川华蓥市常住人口数据:双河街道约11万,乡镇都不突出

四川省广安市唯一的县级市——华蓥市,根据华蓥市第七次全国人口普查公报的数据,华蓥市常住人口约27万人。说实话,这个人口规模并不算多,比不上岳池县的百万人口,是广安市人口最少的县市。这或许和华蓥市的面积有关,华蓥市辖区面积470平方公里,只比

江苏的野心勃勃,都藏在数据里了

来源 | 大数据透析站这是什么水平?作为苏南模式的代表之一,无锡可不是吃素的,按照现在流行的算法,1无锡≈1黑龙江省≈4.3青海省。按照2021年6.45的平均汇率换算,江苏的GDP高达1.8万亿美元,超过澳大利亚、俄罗斯、韩国,略低于全球

中国买来最急需直升机为何不引进生产线?俄方关键数据点破窗户纸

米-17系列现在基本替代了“黑鹰”称为了绝对主力 30年的“黑鹰”现在应急用长期以来,在中国陆航部队中,能够担负高海拔地区运输的只有从美国引进的S-70“黑鹰”中型直升机。那段时间,能够爬上4500米以上高海拔地区的只有“黑鹰”,而且中国的

4860亩!淮北市2022年度供地计划出炉!7宗住宅用地集体亮相

淮北市本级2022年度国有建设用地供应计划2022年度淮北市本级国有建设用地计划供应总量为324.0031公顷(4860.05 亩),其中拟使用存量土地99.2727公顷(31%)(约1489.09 亩), 新增建设用地224.7304公顷

濉溪县数据资源局到县城管局、市大数据中心开展数字濉溪走访调研

濉溪县数据资源局到县城管局、市大数据中心开展数字濉溪走访调研为了解淮北市、濉溪县大数据发展现状和趋势,促进濉溪县大数据快速发展,推进“数字濉溪”建设,9月16日,濉溪县数据资源局党组书记、局长刘溪带领全体职工到濉溪县城管局、淮北大数据中心进

特步半年报数据惊艳,硬科技交出高增长答卷

8月23日,特步国际(1368.HK)发布了2022年上半年财报。特步国际上半年收入达56.84亿元,同比增长37.5%;经营利润实现9.22亿元,同比增长34.8%;普通股股权持有人应占净利润为5.90亿元,同比增长38.4%。整体上看,

一斤能卖5000元,比黄金还贵的黄花梨,农村人为什么不愿意种?

“花梨”一词在清朝和清朝的《西洋朝贡典录》中就有记载。清代大量采用了新品种的花梨木,为了将其与过去的品种区分开来,称为“黄花梨”。 在明清两代鼎盛之时,黄花梨价值连城。据古籍记载,明朝一张黄花梨子的价值是十二两银子,那时候一个丫环的价值,连

友情链接

天天财经元宇宙中国SEO域名抢注宝宝起名网网站监控股市大盘指数分析莫斯科旅游网宠物商机网绍兴黄酒资讯网海澜之家股票黄鹤楼酒资讯网天天基金行情网平顶山新闻头条网大族激光A股口子窖A股今日淄博箭牌家居股票老白干酒股票网桂林三花酒友网杭州旅游网生肖虎运势网生肖龙运势网巨蟹座星座网报喜鸟A股正品莆田鞋官网生肖兔运势网今日烟台生肖羊运势网天秤座第一星座网紫沙壶官网出国留学网月子餐食谱网芬兰旅游网交友征婚信息网江苏旅游网
国内黄金知名品牌有很多,例如:周大福、周生生、老庙黄金、老凤祥、菜百、六福、金至尊等。因各门店黄金价格报价有差异,具体以当地金店黄金报价为准,以下价格仅供参考。
今日金价网 22d.com.cn©2022-2028版权所有