商务服务
提高mysql千万级大数据SQL查询优化几条经验
2024-10-31 13:17

1:查询语句where 子句使用时候优化或者需要注意的

提高mysql千万级大数据SQL查询优化几条经验

2:like语句使用时候需要注意

3:in语句代替语句

4:索引使用或是创建需要注意

假设用户表有一百万用户量。也就是1000000.num是主键

1:对查询进行优化,应尽量避免全表扫描,首先应考虑在where及order by 涉及的列上创建索引。

因为:索引对查询的速度有着至关重要的影响。

2:尽量避免在where字句中对字段进行null值的判断。否则将会导致引擎放弃使用索引而进行全表扫描。

例如:select id from user where num is null 。可以将num是这个字段设置默认值0.确保表中没有null值,然后在进行查询。

sql如下:select id from user where num=0;

(考虑如下情况,假设数据库中一个表有10^6条记录,DBMS的页面大小为4K,并存储100条记录。如果没有索引,查询将对整个表进行扫描,最坏的情况下,如果所有数据页都不在内存,需要读取10^4个页面,如果这10^4个页面在磁盘上随机分布,需要进行10^4次I/O,假设磁盘每次I/O时间为10ms(忽略数据传输时间),则总共需要100s(但实际上要好很多很多)。如果对之建立B-Tree索引,则只需要进行log100(10^6)=3次页面读取,最坏情况下耗时30ms。这就是索引带来的效果,很多时候,当你的应用程序进行SQL查询速度很慢时,应该想想是否可以建索引)

3:应尽量避免在where子句中使用!=或者是<>操作符号。否则引擎将放弃使用索引,进而进行全表扫描。

4:应尽量避免在where子句中使用or来连接条件,否则导致放弃使用索引而进行全表扫描。可以使用 union 或者是 union all代替。

例如: select id from user where num =10 or num =20 这个语句景导致引擎放弃num索引,而要全表扫描来进行处理的。

可以使用union 或者是 union all来代替。如下:

select id from user where num = 10;

union all

select id from user where num =20;

(union 和 nuion all 的区别这里就不赘述了)

5:in 和 not in 也要慎用,否则将会导致全表扫描。

in 对于连续的数组,可以使用between ...and.来代替。

select id from user where num in (1,2,3);

像这样连续的就可以使用between ...and...来代替了。如下:

select id from user where num between 1 and 3;

6:like使用需注意

下面这个查询也将导致全表查询:

select id from user where name like '%三';

如果想提高效率,可以考虑到全文检索。比如solr或是luncene

而下面这个查询却使用到了索引:

select id from user where name like '张%';

7:where子句参数使用时候需注意

如果在where子句中使用参数,也会导致全表扫描。因为sql只会在运行时才会解析局部变量。但优化程序不能将访问计划的选择推迟到运行时;必须在编译时候进行选择。然而,如果在编译时建立访问计划,变量的值还是未知大,因而无法作为索引选择输入项。

如下面的语句将会进行全表扫描:

select id from user where num = @num

进行优化,我们知道num就是主键。是索引。

所以可以改为强制查询使用索引:

select id from user where (index(索引名称)) where num = @num;

8:尽量避免在where子句中对字段进行表达式操作,这将导致引擎放弃使用索引而进行全表扫描。

例如:select id from user where num/2=100

select id from user where num = 100*2;

9:尽量避免爱where子句中对字段进行函数操作,这将导致引擎放弃索引,而进行全表扫描。

select id from user substring(name,1,3) = 'abc' ,这句sql的含义其实就是,查询name以abc开头的用户id

(注:substring(字段,start,end)这个是mysql的截取函数)

select id from user where name like 'abc%';

10:不要在where子句中的"="左边进行函数、算术运算或是使用其他表达式运算,否则系统可能无法正确使用索引

11:复合索引查询注意

在使用索引字段作为条件时候,如果该索引是复合索引,那么必须使用该索引中的第一个字段作为条件时候才能保证系统使用该所以,否则该索引将不会被使用,并且应尽可能的让字段顺序和索引顺序一致。

12:不要写一些没意义的查询。

例如:需要生成一个空表结构和user表结构一样(注:生成的新 new table的表结构和 老表 old table 结构一致)

select col1,col2,col3.....into newTable from user where 1=0

上面这行sql执行后不会返回任何的结果集,但是会消耗系统资源的。

create table newTable (....)这种语句。

13:很多时候用exists 代替 in是一个很好的选择。

比如:

select num from user where num in(select num from newTable);

可以使用下面语句代替:

select num from user a where exists(select num from newTable b where b.num = a.num );

14:并不是所有索引对查询都有效,sql是根据表中数据进行查询优化的,当索引lie(索引字段)有大量重复数据的时候,sql查询可能不会去利用索引。如一表中字段 sex、male、female 几乎各一半。那么即使在sex上创建了索引对查询效率也起不了多大作用。

    以上就是本篇文章【提高mysql千万级大数据SQL查询优化几条经验】的全部内容了,欢迎阅览 ! 文章地址:http://fabua.ksxb.net/news/28.html 
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 迅博思语资讯移动站 http://mip.ksxb.net/ , 查看更多   
最新新闻
针对word.docx文档的关键词索引器
之前曾想做这样一个工具,用来遍历目录下的word.docx文档查询关键词,主要是有几个目的: 1.在项目开始阶段&#
看广告赚钱的app软件排行榜(无限看广告得收益的正规平台)
近年来,随着移动互联网的快速发展,人们对于获取额外收入的需求也不断增加。而随着技术的进步,越来越多的人
抖店 最新版v10.1.0
抖店是一款为电商打造的店铺管理软件,是抖音电商官方出品的商家移动工作台。用户能实时查看业绩,与买家无缝在线联系,还能通过
突破10亿次!“洛川苹果”抖音热点话题再创纪录~
截至7月4日,“#洛川苹果”抖音话题突破10亿次播放!近两年,随着自媒体短视频的兴起,人们对家乡情感的表达方式越来越丰富多样
2017快手网红女神排行榜照片
2017快手网红女神排行榜照片   快手上不仅有帅哥,还有靓妹。在快手上,红人备受网友们关注,特别是高粉丝量的快手红人。那么
贝融助手是什么?来查贝升级版网贷大数据查询工具
贝融助手是什么?贝融助手是原“来查贝”升级后更名,是和信千金类似的网贷大数据查询工具,可以查询身份检测。法院判决文书,法
行车时发生突发事件怎么处理
平时开车的时候,难免会有突发情况。当紧急情况发生时,我们知道恐慌,但不知道如何应对紧急情况。接下来,我们来学习7种应急处
生成汉字的ai
1. 生成汉字的技术是一种利用人工智能算法自动生成汉字的创新技术。该技术基于深度学、自然语言解决和计算机视觉等多个领域的研
教你彻底关闭网页广告,小白都学得会
在前几期的彻底删除弹窗系列文章中,有不少值友表示能不能去除网页广告?李宁的文案说得好:一切皆有可能。今天不仅手把手教你如
抖音里的转化率是什么?转化率计算和提高方法
  在当今数字营销领域,抖音已经成为了一种不可忽视的平台。作为中国最受欢迎的短视频应用之一,抖音拥有庞大的用户群体和广阔
本企业新闻