mysql建立高效的索引實(shí)例分析

本文實(shí)例講述了MySQL建立高效的索引。分享給大家供大家參考,具體如下:

成都創(chuàng)新互聯(lián)公司技術(shù)團(tuán)隊(duì)十年來致力于為客戶提供做網(wǎng)站、成都網(wǎng)站制作品牌網(wǎng)站設(shè)計(jì)、營銷型網(wǎng)站、搜索引擎SEO優(yōu)化等服務(wù)。經(jīng)過多年發(fā)展,公司擁有經(jīng)驗(yàn)豐富的技術(shù)團(tuán)隊(duì),先后服務(wù)、推廣了上千家網(wǎng)站,包括各類中小企業(yè)、企事單位、高校等機(jī)構(gòu)單位。

如何建立理想的索引?

  • 查詢頻繁度
  • 區(qū)分度
  • 索引長度
  • 覆蓋字段

區(qū)分度

假設(shè)100萬用戶,性別基本上男/女各為50W, 區(qū)分度就低。

長度小

索引長度直接影響索引文件的大小,影響增刪改的速度,并間接影響查詢速度(占用內(nèi)存多).

區(qū)分度高,長度小

問題:如果讓區(qū)分度高,而長度小?

答:可以針對列中的值,從左往右截取部分,來建索引

(1)截的越短, 重復(fù)度越高,區(qū)分度越小, 索引效果越不好
(2)截的越長, 重復(fù)度越低,區(qū)分度越高, 索引效果越好,但帶來的影響也越大–增刪改變慢,并間影響查詢速度.

所以, 我們要在 區(qū)分度 + 長度 兩者上,取得一個(gè)平衡。慣用手法:截取不同長度,并測試其區(qū)分度。

假設(shè)我們有一張表:英語4級的單詞表,里面有13324條記錄,我們怎么給name字段加索引呢?

mysql建立高效的索引實(shí)例分析

如果計(jì)算區(qū)分度?

截取單詞第1位的不重復(fù)數(shù):

select count(distinct left(name,1)) from dict

總的數(shù)量:

select count(*) from dict

區(qū)分度:不重復(fù)數(shù)/總的數(shù)量,sql語句如下:

select (select count(distinct left(name,1)) from dict) / (select count(*) from dict) as rate;

然后按照這樣的步驟把其他長度所對應(yīng)的區(qū)分度給找出來,看一個(gè)這個(gè)圖表,可以知道當(dāng)長度為11的時(shí)候重復(fù)度僅僅為1%,我們可以考慮建立11位長的索引

mysql建立高效的索引實(shí)例分析

alter table dict add index name name(11);

左前綴不好區(qū)分的情況

對于左前綴不易區(qū)分的列 ,建立索引的技巧

如url列

http://www.baidu.com
http://www.web-bc.cn

列的前11個(gè)字符都是一樣的,不易區(qū)分, 可以用如下2個(gè)辦法來解決

(1)把列內(nèi)容倒過來存儲(chǔ),并建立索引

moc.udiab.www//:ptth
nc.cb-bew.www//://ptth

這樣左前綴區(qū)分度大

(2)偽hash索引效果

同時(shí)存url和url_hash列

#建表
create table t10 (
id int primary key,
url char(60) not null default ''
);
#插入數(shù)據(jù)
insert into t10 values
(1,'http://www.baidu.com'),
(2,'http://www.sina.com'),
(3,'http://www.sohu.com.cn'),
(4,'http://www.onlinedown.net'),
(5,'http://www.gov.cn');
#修改表結(jié)構(gòu),添加urlcrc列
alter table t10 add urlcrc int unsigned not null;

在存儲(chǔ)的時(shí)候,將url對應(yīng)的crc32碼一同插入到數(shù)據(jù)庫中,然后按照urlcrc字段建立索引,然后查找的時(shí)候,我們在業(yè)務(wù)層中將對應(yīng)的url轉(zhuǎn)換為crc32進(jìn)行查找,就可以利用上索引了。

因?yàn)閏rc的結(jié)果是32位int無符號數(shù),因此當(dāng)數(shù)據(jù)超過40億,也會(huì)有重復(fù),但這是值得的.(索引長度為int4個(gè)字節(jié))

多列索引

多列索引的考慮因素—列的查詢頻率 , 列的區(qū)分度, 注意一定要結(jié)合實(shí)際業(yè)務(wù)場景

以ecshop商城為例, goods表中的cat_id,brand_id,做多列索引,從區(qū)分度看,brand_id區(qū)分度更高, 但從 商城的實(shí)際業(yè)務(wù)業(yè)務(wù)看, 顧客一般先選大分類->小分類->品牌,最終選擇建立2個(gè)索引:

(1)index(cat_id,brand_id)
(2)index(cat_id,shop_price)

甚至可以再加 (3)index(cat_id,brand_id,shop_price),3個(gè)冗余索引

但(3)中的前2列和(1)中的前2列一樣,所以可以再去掉(1),建立2個(gè)索引

index(cat_id,price)index(cat_id,brand_id,shop_price);

更多關(guān)于MySQL相關(guān)內(nèi)容感興趣的讀者可查看本站專題:《MySQL索引操作技巧匯總》、《MySQL常用函數(shù)大匯總》、《MySQL日志操作技巧大全》、《MySQL事務(wù)操作技巧匯總》、《MySQL存儲(chǔ)過程技巧大全》及《MySQL數(shù)據(jù)庫鎖相關(guān)技巧匯總》

希望本文所述對大家MySQL數(shù)據(jù)庫計(jì)有所幫助。

分享名稱:mysql建立高效的索引實(shí)例分析
URL標(biāo)題:http://muchs.cn/article16/jehhdg.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供、定制網(wǎng)站虛擬主機(jī)、動(dòng)態(tài)網(wǎng)站軟件開發(fā)、外貿(mào)網(wǎng)站建設(shè)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

成都網(wǎng)站建設(shè)