mysql怎么進(jìn)行分表 mysql分表方法

mysql怎么做merge分表

mysql merge分表操作

目前成都創(chuàng)新互聯(lián)已為上千家的企業(yè)提供了網(wǎng)站建設(shè)、域名、網(wǎng)站空間、成都網(wǎng)站托管、企業(yè)網(wǎng)站設(shè)計(jì)、丹陽(yáng)網(wǎng)站維護(hù)等服務(wù)，公司將堅(jiān)持客戶導(dǎo)向、應(yīng)用為本的策略，正道將秉承"和諧、參與、激情"的文化，與客戶和合作伙伴齊心協(xié)力一起成長(zhǎng)，共同發(fā)展。

三個(gè)分表：

CREATE TABLE `test_1` (

id INT(11) NOT NULL DEFAULT '0',

email varchar(50) NOT NULL ,

PRIMARY KEY (`id`)

) ENGINE=MyISAM DEFAULT CHARSET=UTF8;

CREATE TABLE `test_2` (

id INT(11) NOT NULL DEFAULT '0',

email varchar(50) NOT NULL ,

PRIMARY KEY (`id`)

) ENGINE=MyISAM DEFAULT CHARSET=UTF8;

CREATE TABLE `test_3` (

id INT(11) NOT NULL DEFAULT '0',

email varchar(50) NOT NULL ,

PRIMARY KEY (`id`)

) ENGINE=MyISAM DEFAULT CHARSET=UTF8;

一個(gè)總表：

CREATE TABLE `test` (

`id` INT(11) NOT NULL DEFAULT '0'

email varchar(50) NOT NULL

key `i_id` (`id`),

) ENGINE=MRG_MyISAM UNION=(test_1,test_2,test_3) DEFAULT CHARSET=UTF8;

在總表test上面select *的話，會(huì)取出三個(gè)分表中的數(shù)據(jù)。

在插入數(shù)據(jù)的時(shí)候根據(jù)對(duì)象的hash code 取模運(yùn)算，如果余數(shù)為 3 那么就插入 test_3 這個(gè)表中。

淺談mysql數(shù)據(jù)庫(kù)分庫(kù)分表那些事-億級(jí)數(shù)據(jù)存儲(chǔ)方案

mysql分庫(kù)分表一般有如下場(chǎng)景

其中1，2相對(duì)較容易實(shí)現(xiàn),本文重點(diǎn)講講水平拆表和水平拆庫(kù),以及基于mybatis插件方式實(shí)現(xiàn)水平拆分方案落地。

在《聊一聊擴(kuò)展字段設(shè)計(jì)》一文中有講解到基于KV水平存儲(chǔ)擴(kuò)展字段方案,這就是非常典型的可以水平分表的場(chǎng)景。主表和kv表是一對(duì)N關(guān)系,隨著主表數(shù)據(jù)量增長(zhǎng),KV表最大N倍線性增長(zhǎng)。

這里我們以分KV表水平拆分為場(chǎng)景

對(duì)于kv擴(kuò)展字段查詢,只會(huì)根據(jù)id + key 或者 id 為條件的方式查詢,所以這里我們可以按照id 分片即可

分512張表(實(shí)際場(chǎng)景具體分多少表還得根據(jù)字段增加的頻次而定)

分表后表名為kv_000 ~ kv_511

id % 512 = 1 .... 分到 kv_001,

id % 512 = 2 .... 分到 kv_002

依次類推!

水平分表相對(duì)比較容易,后面會(huì)講到基于mybatis插件實(shí)現(xiàn)方案

場(chǎng)景:以下我們基于博客文章表分庫(kù)場(chǎng)景來(lái)分析

目標(biāo):

表結(jié)構(gòu)如下(節(jié)選部分字段):

按照user_id sharding

假如分1024個(gè)庫(kù),按照user_id % 1024 hash

user_id % 1024 = 1 分到db_001庫(kù)

user_id % 1024 = 2 分到db_002庫(kù)

依次類推

目前是2個(gè)節(jié)點(diǎn),假如后期達(dá)到瓶頸,我們可以增加至4個(gè)節(jié)點(diǎn)

最多可以增加只1024個(gè)節(jié)點(diǎn),性能線性增長(zhǎng)

對(duì)于水平分表/分庫(kù)后,非shardingKey查詢首先得考慮到

基于mybatis分庫(kù)分表,一般常用的一種是基于spring AOP方式, 另外一種基于mybatis插件。其實(shí)兩種方式思路差不多。

為了比較直觀解決這個(gè)問(wèn)題,我分別在Executor 和StatementHandler階段2個(gè)攔截器

實(shí)現(xiàn)動(dòng)態(tài)數(shù)據(jù)源獲取接口

測(cè)試結(jié)果如下

由此可知,我們需要在Executor階段切換數(shù)據(jù)源

對(duì)于分庫(kù):

原始sql:

目標(biāo)sql:

其中定義了三個(gè)注解

@useMaster 是否強(qiáng)制讀主

@shardingBy 分片標(biāo)識(shí)

@DB 定義邏輯表名庫(kù)名以及分片策略

1)編寫(xiě)entity

Insert

select

以上順利實(shí)現(xiàn)mysql分庫(kù),同樣的道理實(shí)現(xiàn)同時(shí)分庫(kù)分表也很容易實(shí)現(xiàn)。

此插件具體實(shí)現(xiàn)方案已開(kāi)源:

目錄如下:

mysql分庫(kù)分表,首先得找到瓶頸在哪里(IO or CPU),是分庫(kù)還是分表,分多少？不能為了分庫(kù)分表而拆分。

原則上是盡量先垂直拆分后水平拆分。

以上基于mybatis插件分庫(kù)分表是一種實(shí)現(xiàn)思路,還有很多不完善的地方,

例如:

MySQL數(shù)據(jù)庫(kù)性能優(yōu)化之分區(qū)分表分庫(kù)

分表是分散數(shù)據(jù)庫(kù)壓力的好方法。

分表，最直白的意思，就是將一個(gè)表結(jié)構(gòu)分為多個(gè)表，然后，可以再同一個(gè)庫(kù)里，也可以放到不同的庫(kù)。

當(dāng)然，首先要知道什么情況下，才需要分表。個(gè)人覺(jué)得單表記錄條數(shù)達(dá)到百萬(wàn)到千萬(wàn)級(jí)別時(shí)就要使用分表了。

分表的分類

**1、縱向分表**

將本來(lái)可以在同一個(gè)表的內(nèi)容，人為劃分為多個(gè)表。（所謂的本來(lái)，是指按照關(guān)系型數(shù)據(jù)庫(kù)的第三范式要求，是應(yīng)該在同一個(gè)表的。）

分表理由：根據(jù)數(shù)據(jù)的活躍度進(jìn)行分離，（因?yàn)椴煌钴S的數(shù)據(jù)，處理方式是不同的）

案例：

對(duì)于一個(gè)博客系統(tǒng)，文章標(biāo)題，作者，分類，創(chuàng)建時(shí)間等，是變化頻率慢，查詢次數(shù)多，而且最好有很好的實(shí)時(shí)性的數(shù)據(jù)，我們把它叫做冷數(shù)據(jù)。而博客的瀏覽量，回復(fù)數(shù)等，類似的統(tǒng)計(jì)信息，或者別的變化頻率比較高的數(shù)據(jù)，我們把它叫做活躍數(shù)據(jù)。所以，在進(jìn)行數(shù)據(jù)庫(kù)結(jié)構(gòu)設(shè)計(jì)的時(shí)候，就應(yīng)該考慮分表，首先是縱向分表的處理。

這樣縱向分表后：

首先存儲(chǔ)引擎的使用不同，冷數(shù)據(jù)使用MyIsam 可以有更好的查詢數(shù)據(jù)?；钴S數(shù)據(jù)，可以使用Innodb ,可以有更好的更新速度。

其次，對(duì)冷數(shù)據(jù)進(jìn)行更多的從庫(kù)配置，因?yàn)楦嗟牟僮鲿r(shí)查詢，這樣來(lái)加快查詢速度。對(duì)熱數(shù)據(jù)，可以相對(duì)有更多的主庫(kù)的橫向分表處理。

其實(shí)，對(duì)于一些特殊的活躍數(shù)據(jù)，也可以考慮使用memcache ,redis之類的緩存，等累計(jì)到一定量再去更新數(shù)據(jù)庫(kù)?；蛘適ongodb 一類的nosql 數(shù)據(jù)庫(kù)，這里只是舉例，就先不說(shuō)這個(gè)。

**2、橫向分表**

字面意思，就可以看出來(lái)，是把大的表結(jié)構(gòu)，橫向切割為同樣結(jié)構(gòu)的不同表，如，用戶信息表，user_1,user_2等。表結(jié)構(gòu)是完全一樣，但是，根據(jù)某些特定的規(guī)則來(lái)劃分的表，如根據(jù)用戶ID來(lái)取模劃分。

分表理由：根據(jù)數(shù)據(jù)量的規(guī)模來(lái)劃分，保證單表的容量不會(huì)太大，從而來(lái)保證單表的查詢等處理能力。

案例：同上面的例子，博客系統(tǒng)。當(dāng)博客的量達(dá)到很大時(shí)候，就應(yīng)該采取橫向分割來(lái)降低每個(gè)單表的壓力，來(lái)提升性能。例如博客的冷數(shù)據(jù)表，假如分為100個(gè)表，當(dāng)同時(shí)有100萬(wàn)個(gè)用戶在瀏覽時(shí)，如果是單表的話，會(huì)進(jìn)行100萬(wàn)次請(qǐng)求，而現(xiàn)在分表后，就可能是每個(gè)表進(jìn)行1萬(wàn)個(gè)數(shù)據(jù)的請(qǐng)求（因?yàn)?，不可能絕對(duì)的平均，只是假設(shè)），這樣壓力就降低了很多很多。

延伸：為什么要分表和分區(qū)？

日常開(kāi)發(fā)中我們經(jīng)常會(huì)遇到大表的情況，所謂的大表是指存儲(chǔ)了百萬(wàn)級(jí)乃至千萬(wàn)級(jí)條記錄的表。這樣的表過(guò)于龐大，導(dǎo)致數(shù)據(jù)庫(kù)在查詢和插入的時(shí)候耗時(shí)太長(zhǎng)，性能低下，如果涉及聯(lián)合查詢的情況，性能會(huì)更加糟糕。分表和表分區(qū)的目的就是減少數(shù)據(jù)庫(kù)的負(fù)擔(dān)，提高數(shù)據(jù)庫(kù)的效率，通常點(diǎn)來(lái)講就是提高表的增刪改查效率。

什么是分表？

分表是將一個(gè)大表按照一定的規(guī)則分解成多張具有獨(dú)立存儲(chǔ)空間的實(shí)體表，我們可以稱為子表，每個(gè)表都對(duì)應(yīng)三個(gè)文件，MYD數(shù)據(jù)文件，.MYI索引文件，.frm表結(jié)構(gòu)文件。這些子表可以分布在同一塊磁盤(pán)上，也可以在不同的機(jī)器上。app讀寫(xiě)的時(shí)候根據(jù)事先定義好的規(guī)則得到對(duì)應(yīng)的子表名，然后去操作它。

什么是分區(qū)？

分區(qū)和分表相似，都是按照規(guī)則分解表。不同在于分表將大表分解為若干個(gè)獨(dú)立的實(shí)體表，而分區(qū)是將數(shù)據(jù)分段劃分在多個(gè)位置存放，可以是同一塊磁盤(pán)也可以在不同的機(jī)器。分區(qū)后，表面上還是一張表，但數(shù)據(jù)散列到多個(gè)位置了。app讀寫(xiě)的時(shí)候操作的還是大表名字，db自動(dòng)去組織分區(qū)的數(shù)據(jù)。

**MySQL分表和分區(qū)有什么聯(lián)系呢？**

1、都能提高mysql的性高，在高并發(fā)狀態(tài)下都有一個(gè)良好的表現(xiàn)。

2、分表和分區(qū)不矛盾，可以相互配合的，對(duì)于那些大訪問(wèn)量，并且表數(shù)據(jù)比較多的表，我們可以采取分表和分區(qū)結(jié)合的方式（如果merge這種分表方式，不能和分區(qū)配合的話，可以用其他的分表試），訪問(wèn)量不大，但是表數(shù)據(jù)很多的表，我們可以采取分區(qū)的方式等。

3、分表技術(shù)是比較麻煩的，需要手動(dòng)去創(chuàng)建子表，app服務(wù)端讀寫(xiě)時(shí)候需要計(jì)算子表名。采用merge好一些，但也要?jiǎng)?chuàng)建子表和配置子表間的union關(guān)系。

4、表分區(qū)相對(duì)于分表，操作方便，不需要?jiǎng)?chuàng)建子表。

我們知道對(duì)于大型的互聯(lián)網(wǎng)應(yīng)用，數(shù)據(jù)庫(kù)單表的數(shù)據(jù)量可能達(dá)到千萬(wàn)甚至上億級(jí)別，同時(shí)面臨這高并發(fā)的壓力。Master-Slave結(jié)構(gòu)只能對(duì)數(shù)據(jù)庫(kù)的讀能力進(jìn)行擴(kuò)展，寫(xiě)操作還是集中在Master中，Master并不能無(wú)限制的掛接Slave庫(kù)，如果需要對(duì)數(shù)據(jù)庫(kù)的吞吐能力進(jìn)行進(jìn)一步的擴(kuò)展，可以考慮采用分庫(kù)分表的策略。

**1、分表**

在分表之前，首先要選中合適的分表策略（以哪個(gè)字典為分表字段，需要將數(shù)據(jù)分為多少?gòu)埍恚箶?shù)據(jù)能夠均衡的分布在多張表中，并且不影響正常的查詢。在企業(yè)級(jí)應(yīng)用中，往往使用org_id(組織主鍵)做為分表字段，在互聯(lián)網(wǎng)應(yīng)用中往往是userid。在確定分表策略后，當(dāng)數(shù)據(jù)進(jìn)行存儲(chǔ)及查詢時(shí)，需要確定到哪張表里去查找數(shù)據(jù)，

數(shù)據(jù)存放的數(shù)據(jù)表 = 分表字段的內(nèi)容 % 分表數(shù)量

**2、分庫(kù)**

分表能夠解決單表數(shù)據(jù)量過(guò)大帶來(lái)的查詢效率下降的問(wèn)題，但是不能給數(shù)據(jù)庫(kù)的并發(fā)訪問(wèn)帶來(lái)質(zhì)的提升，面對(duì)高并發(fā)的寫(xiě)訪問(wèn)，當(dāng)Master無(wú)法承擔(dān)高并發(fā)的寫(xiě)入請(qǐng)求時(shí)，不管如何擴(kuò)展Slave服務(wù)器，都沒(méi)有意義了。我們通過(guò)對(duì)數(shù)據(jù)庫(kù)進(jìn)行拆分，來(lái)提高數(shù)據(jù)庫(kù)的寫(xiě)入能力，即所謂的分庫(kù)。分庫(kù)采用對(duì)關(guān)鍵字取模的方式，對(duì)數(shù)據(jù)庫(kù)進(jìn)行路由。

數(shù)據(jù)存放的數(shù)據(jù)庫(kù)=分庫(kù)字段的內(nèi)容%數(shù)據(jù)庫(kù)的數(shù)量

**3、即分表又分庫(kù)**

數(shù)據(jù)庫(kù)分表可以解決單表海量數(shù)據(jù)的查詢性能問(wèn)題，分庫(kù)可以解決單臺(tái)數(shù)據(jù)庫(kù)的并發(fā)訪問(wèn)壓力問(wèn)題。

當(dāng)數(shù)據(jù)庫(kù)同時(shí)面臨海量數(shù)據(jù)存儲(chǔ)和高并發(fā)訪問(wèn)的時(shí)候，需要同時(shí)采取分表和分庫(kù)策略。一般分表分庫(kù)策略如下：

中間變量 = 關(guān)鍵字%（數(shù)據(jù)庫(kù)數(shù)量*單庫(kù)數(shù)據(jù)表數(shù)量）

庫(kù) = 取整（中間變量/單庫(kù)數(shù)據(jù)表數(shù)量）

表 = （中間變量%單庫(kù)數(shù)據(jù)表數(shù)量）

實(shí)例：

1、分庫(kù)分表

很明顯，一個(gè)主表（也就是很重要的表，例如用戶表）無(wú)限制的增長(zhǎng)勢(shì)必嚴(yán)重影響性能，分庫(kù)與分表是一個(gè)很不錯(cuò)的解決途徑，也就是性能優(yōu)化途徑，現(xiàn)在的案例是我們有一個(gè)1000多萬(wàn)條記錄的用戶表members,查詢起來(lái)非常之慢，同事的做法是將其散列到100個(gè)表中，分別從members0到members99，然后根據(jù)mid分發(fā)記錄到這些表中，牛逼的代碼大概是這樣子：

復(fù)制代碼代碼如下:

?php

for($i=0;$i 100; $i++ ){

//echo "CREATE TABLE db2.members{$i} LIKE db1.members

echo "INSERT INTO members{$i} SELECT * FROM members WHERE mid%100={$i}

}

2、不停機(jī)修改mysql表結(jié)構(gòu)

同樣還是members表，前期設(shè)計(jì)的表結(jié)構(gòu)不盡合理，隨著數(shù)據(jù)庫(kù)不斷運(yùn)行，其冗余數(shù)據(jù)也是增長(zhǎng)巨大，同事使用了下面的方法來(lái)處理：

先創(chuàng)建一個(gè)臨時(shí)表：

/*創(chuàng)建臨時(shí)表*/

CREATE TABLE members_tmp LIKE members

然后修改members_tmp的表結(jié)構(gòu)為新結(jié)構(gòu)，接著使用上面那個(gè)for循環(huán)來(lái)導(dǎo)出數(shù)據(jù)，因?yàn)?000萬(wàn)的數(shù)據(jù)一次性導(dǎo)出是不對(duì)的，mid是主鍵，一個(gè)區(qū)間一個(gè)區(qū)間的導(dǎo)，基本是一次導(dǎo)出5萬(wàn)條吧，這里略去了

接著重命名將新表替換上去：

/*這是個(gè)頗為經(jīng)典的語(yǔ)句哈*/

RENAME TABLE members TO members_bak,members_tmp TO members;

就是這樣，基本可以做到無(wú)損失，無(wú)需停機(jī)更新表結(jié)構(gòu)，但實(shí)際上RENAME期間表是被鎖死的，所以選擇在線少的時(shí)候操作是一個(gè)技巧。經(jīng)過(guò)這個(gè)操作，使得原先8G多的表，一下子變成了2G多。

mysql數(shù)據(jù)庫(kù)要放1億條信息怎樣分表?

mysql數(shù)據(jù)庫(kù)對(duì)1億條數(shù)據(jù)的分表方法設(shè)計(jì)：

目前針對(duì)海量數(shù)據(jù)的優(yōu)化有兩種方法：

（1）垂直分割

優(yōu)勢(shì)：降低高并發(fā)情況下，對(duì)于表的鎖定。

不足：對(duì)于單表來(lái)說(shuō)，隨著數(shù)據(jù)庫(kù)的記錄增多，讀寫(xiě)壓力將進(jìn)一步增大。

（2）水平分割

如果單表的IO壓力大，可以考慮用水平分割，其原理就是通過(guò)hash算法，將一張表分為N多頁(yè)，并通過(guò)一個(gè)新的表（總表），記錄著每個(gè)頁(yè)的的位置。

假如一個(gè)門(mén)戶網(wǎng)站，它的數(shù)據(jù)庫(kù)表已經(jīng)達(dá)到了1億條記錄，那么此時(shí)如果通過(guò)select去查詢，必定會(huì)效率低下（不做索引的前提下）。為了降低單表的讀寫(xiě)IO壓力，通過(guò)水平分割，將這個(gè)表分成10個(gè)頁(yè)，同時(shí)生成一個(gè)總表，記錄各個(gè)頁(yè)的信息，那么假如我查詢一條id=100的記錄，它不再需要全表掃描，而是通過(guò)總表找到該記錄在哪個(gè)對(duì)應(yīng)的頁(yè)上，然后再去相應(yīng)的頁(yè)做檢索，這樣就降低了IO壓力。

文章名稱：mysql怎么進(jìn)行分表 mysql分表方法
網(wǎng)頁(yè)鏈接：http://muchs.cn/article48/doeeshp.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供網(wǎng)站制作、靜態(tài)網(wǎng)站、軟件開(kāi)發(fā)、定制網(wǎng)站、域名注冊(cè)、關(guān)鍵詞優(yōu)化

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請(qǐng)盡快告知，我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如需處理請(qǐng)聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時(shí)需注明來(lái)源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容