mysql亂碼是怎么回事 mysql亂碼問(wèn)題怎么解決

mysql數(shù)據(jù)庫(kù)中存進(jìn)的是中文,為什么查出來(lái)的亂碼?

一、轉(zhuǎn)碼失敗

創(chuàng)新互聯(lián)建站從2013年開(kāi)始,先為云南等服務(wù)建站,云南等地企業(yè),進(jìn)行企業(yè)商務(wù)咨詢(xún)服務(wù)。為云南企業(yè)網(wǎng)站制作PC+手機(jī)+微官網(wǎng)三網(wǎng)同步一站式服務(wù)解決您的所有建站問(wèn)題。

在數(shù)據(jù)寫(xiě)入到表的過(guò)程中轉(zhuǎn)碼失敗,數(shù)據(jù)庫(kù)端也沒(méi)有進(jìn)行恰當(dāng)?shù)奶幚恚瑢?dǎo)致存放在表里的數(shù)據(jù)亂碼。

針對(duì)這種情況,前幾篇文章介紹過(guò)客戶(hù)端發(fā)送請(qǐng)求到服務(wù)端。

其中任意一個(gè)編碼不一致,都會(huì)導(dǎo)致表里的數(shù)據(jù)存入不正確的編碼而產(chǎn)生亂碼。

比如下面簡(jiǎn)單一條語(yǔ)句:

set @a = "文本字符串";

insert into t1 values(@a);

變量 @a 的字符編碼是由參數(shù) CHARACTER_SET_CLIENT 決定的,假設(shè)此時(shí)編碼為 A,也就是變量 @a 的編碼。

2. 寫(xiě)入語(yǔ)句在發(fā)送到 MySQL 服務(wù)端之前的編碼由 CHARACTER_SET_CONNECTION 決定,假設(shè)此時(shí)編碼為 B。

3. 經(jīng)過(guò) MySQL 一系列詞法,語(yǔ)法解析等處理后,寫(xiě)入到表 t1,表 t1 的編碼為 C。

那這里編碼 A、編碼 B、編碼 C 如果不兼容,寫(xiě)入的數(shù)據(jù)就直接亂碼。

二、客戶(hù)端亂碼

表數(shù)據(jù)正常,但是客戶(hù)端展示后出現(xiàn)亂碼。

這一類(lèi)場(chǎng)景,指的是從 MySQL 表里拿數(shù)據(jù)出來(lái)返回到客戶(hù)端,MySQL 里的數(shù)據(jù)本身沒(méi)有問(wèn)題??蛻?hù)端發(fā)送請(qǐng)求到 MySQL,表的編碼為 D,從 MySQL 拿到記錄結(jié)果傳輸?shù)娇蛻?hù)端,此時(shí)記錄編碼為 E(CHARACTER_SET_RESULTS)。

那以上編碼 E 和 D 如果不兼容,檢索出來(lái)的數(shù)據(jù)就看起來(lái)亂碼了。但是由于數(shù)據(jù)本身沒(méi)有被破壞,所以換個(gè)兼容的編碼就可以獲取正確的結(jié)果。

這一類(lèi)又分為以下三個(gè)不同的小類(lèi):

1)字段編碼和表一致,客戶(hù)端是不同的編碼

比如下面例子, 表數(shù)據(jù)的編碼是 utf8mb4,而 SESSION 1 發(fā)起的連接編碼為 gbk。那由于編碼不兼容,檢索出來(lái)的數(shù)據(jù)肯定為亂碼。

2)表編碼和客戶(hù)端的編碼一致,但是記錄之間編碼存在不一致的情形

比如表編碼是 utf8mb4,應(yīng)用端編碼也是 utf8mb4,但是表里的數(shù)據(jù)可能一半編碼是 utf8mb4,另外一半是 gbk。那么此時(shí)表的數(shù)據(jù)也是正常的,不過(guò)此時(shí)采用哪種編碼都讀不到所有完整的數(shù)據(jù)。這樣數(shù)據(jù)產(chǎn)生的原因很多,比如其中一種可能性就是表編碼多次變更而且每次變更不徹底導(dǎo)致(變更不徹底,我之前的篇章里有介紹)。舉個(gè)例子,表 t3 的編碼之前是 utf8mb4,現(xiàn)在是 gbk,而且兩次編碼期間都被寫(xiě)入了正常的數(shù)據(jù)。

3)每個(gè)字段的編碼不一致,導(dǎo)致亂碼和第二點(diǎn)一樣的場(chǎng)景。不同的是:非記錄間的編碼不統(tǒng)一,而是每個(gè)字段編碼不統(tǒng)一。舉個(gè)例子,表 c1 字段 a1,a2。a1 編碼 gbk,a2 編碼是 utf8mb4。那每個(gè)字段單獨(dú)讀出來(lái)數(shù)據(jù)是完整的,但是所有字段一起讀出來(lái),數(shù)據(jù)總會(huì)有一部分亂碼。

三、LATIN1

還有一種情形就是以 LATIN1 的編碼存儲(chǔ)數(shù)據(jù)

估計(jì)大家都知道字符集 LATIN1,LATIN1 對(duì)所有字符都是單字節(jié)流處理,遇到不能處理的字節(jié)流,保持原樣,那么在以上兩種存入和檢索的過(guò)程中都能保證數(shù)據(jù)一致,所以 MySQL 長(zhǎng)期以來(lái)默認(rèn)的編碼都是 LATIN1。這種情形,看起來(lái)也沒(méi)啥不對(duì)的點(diǎn),數(shù)據(jù)也沒(méi)亂碼,那為什么還有選用其他的編碼呢?原因就是對(duì)字符存儲(chǔ)的字節(jié)數(shù)不一樣,比如 emoji 字符 "?",如果用 utf8mb4 存儲(chǔ),占用 3 個(gè)字節(jié),那 varchar(12) 就能存放 12 個(gè)字符,但是換成 LATIN1,只能存 4 個(gè)字符。

mysql中文亂碼

MySQL會(huì)出現(xiàn)中文亂碼的原因不外乎下列幾點(diǎn):

1.server本身設(shè)定問(wèn)題。

2.table的語(yǔ)系設(shè)定問(wèn)題(包含character與collation)

3.客戶(hù)端程式(例如php)的連線(xiàn)語(yǔ)系設(shè)定問(wèn)題強(qiáng)烈建議使用utf8。utf8可以兼容世界上所有字符!

一、避免創(chuàng)建數(shù)據(jù)庫(kù)及表出現(xiàn)中文亂碼和查看編碼方法

1、創(chuàng)建數(shù)據(jù)庫(kù)的時(shí)候:CREATE DATABASE `test`

CHARACTER SET 'utf8'

COLLATE 'utf8_general_ci';

2、建表的時(shí)候 CREATE TABLE `database_user` (

`ID` varchar(40) NOT NULL default '',

`UserID` varchar(40) NOT NULL default '',

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

這2個(gè)設(shè)置好了,基本就不會(huì)出問(wèn)題了,即建庫(kù)和建表時(shí)都使用相同的編碼格式。

但是如果已經(jīng)建了庫(kù)和表可以通過(guò)以下方式進(jìn)行查詢(xún)。

1.查看默認(rèn)的編碼格式:

mysql show variables like "%char%";

+--------------------------+---------------+

| Variable_name | Value |

+--------------------------+---------------+

| character_set_client | gbk |

| character_set_connection | gbk |

| character_set_database | utf8 |

| character_set_filesystem | binary |

| character_set_results | gbk |

| character_set_server | utf8 |

| character_set_system | utf8 |

+--------------------------+-------------+

注:以前2個(gè)來(lái)確定,可以使用set names utf8,set names gbk設(shè)置默認(rèn)的編碼格式;

執(zhí)行SET NAMES utf8的效果等同于同時(shí)設(shè)定如下:

SET character_set_client='utf8';

SET character_set_connection='utf8';

SET character_set_results='utf8';

2.查看test數(shù)據(jù)庫(kù)的編碼格式:

mysql show create database test;

+------------+------------------------------------------------------------------------------------------------+

| Database | Create Database |

+------------+------------------------------------------------------------------------------------------------+

| test | CREATE DATABASE `test` /*!40100 DEFAULT CHARACTER SET gbk */ |

+------------+------------------------------------------------------------------------------------------------+

3.查看yjdb數(shù)據(jù)庫(kù)的編碼格式:

mysql show create table yjdb;

| yjdb | CREATE TABLE `yjdb` (

`sn` int(5) NOT NULL AUTO_INCREMENT,

`type` varchar(10) NOT NULL,

`brc` varchar(6) NOT NULL,

`teller` int(6) NOT NULL,

`telname` varchar(10) NOT NULL,

`date` int(10) NOT NULL,

`count` int(6) NOT NULL,

`back` int(10) NOT NULL,

PRIMARY KEY (`sn`),

UNIQUE KEY `sn` (`sn`),

UNIQUE KEY `sn_2` (`sn`)

) ENGINE=MyISAM AUTO_INCREMENT=1826 DEFAULT CHARSET=gbk ROW_FORMAT=DYNAMIC |

二、避免導(dǎo)入數(shù)據(jù)有中文亂碼的問(wèn)題

1:將數(shù)據(jù)編碼格式保存為utf-8

設(shè)置默認(rèn)編碼為utf8:

set names utf8;

設(shè)置數(shù)據(jù)庫(kù)db_name默認(rèn)為utf8:

ALTER DATABASE `db_name` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;

設(shè)置表tb_name默認(rèn)編碼為utf8:

ALTER TABLE `tb_name` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;

導(dǎo)入:

LOAD DATA LOCAL INFILE 'C:\\utf8.txt' INTO TABLE yjdb;

2:將數(shù)據(jù)編碼格式保存為ansi(即GBK或GB2312)

設(shè)置默認(rèn)編碼為gbk:

set names gbk;

設(shè)置數(shù)據(jù)庫(kù)db_name默認(rèn)編碼為gbk:

ALTER DATABASE `db_name` DEFAULT CHARACTER SET gbk COLLATE gbk_chinese_ci;

設(shè)置表tb_name默認(rèn)編碼為gbk:

ALTER TABLE `tb_name` DEFAULT CHARACTER SET gbk COLLATE gbk_chinese_ci;

導(dǎo)入:

LOAD DATA LOCAL INFILE 'C:\\gbk.txt' INTO TABLE yjdb;

注:1.UTF8不要導(dǎo)入gbk,gbk不要導(dǎo)入U(xiǎn)TF8;

2.dos下不支持UTF8的顯示;

三、解決網(wǎng)頁(yè)中亂碼的問(wèn)題

將網(wǎng)站編碼設(shè)為 utf-8,這樣可以兼容世界上所有字符。

如果網(wǎng)站已經(jīng)運(yùn)作了好久,已有很多舊數(shù)據(jù),不能再更改簡(jiǎn)體中文的設(shè)定,那么建議將頁(yè)面的編碼設(shè)為 GBK, GBK與GB2312的區(qū)別就在于:GBK能比GB2312顯示更多的字符,要顯示簡(jiǎn)體碼的繁體字,就只能用GBK。

1.編輯/etc/my.cnf ,在[mysql]段加入default_character_set=utf8;

2.在編寫(xiě)Connection URL時(shí),加上?useUnicode=truecharacterEncoding=utf-8參;

3.在網(wǎng)頁(yè)代碼中加上一個(gè)"set names utf8"或者"set names gbk"的指令,告訴MySQL連線(xiàn)內(nèi)容都要使用utf8或者gbk。

mysql中文亂碼問(wèn)題

一、轉(zhuǎn)碼失敗

在數(shù)據(jù)寫(xiě)入到表的過(guò)程中轉(zhuǎn)碼失敗,數(shù)據(jù)庫(kù)端也沒(méi)有進(jìn)行恰當(dāng)?shù)奶幚?,?dǎo)致存放在表里的數(shù)據(jù)亂碼。

針對(duì)這種情況,前幾篇文章介紹過(guò)客戶(hù)端發(fā)送請(qǐng)求到服務(wù)端。

其中任意一個(gè)編碼不一致,都會(huì)導(dǎo)致表里的數(shù)據(jù)存入不正確的編碼而產(chǎn)生亂碼。

比如下面簡(jiǎn)單一條語(yǔ)句:

set @a = "文本字符串";

insert into t1 values(@a);

變量 @a 的字符編碼是由參數(shù) CHARACTER_SET_CLIENT 決定的,假設(shè)此時(shí)編碼為 A,也就是變量 @a 的編碼。

2. 寫(xiě)入語(yǔ)句在發(fā)送到 MySQL 服務(wù)端之前的編碼由 CHARACTER_SET_CONNECTION 決定,假設(shè)此時(shí)編碼為 B。

3. 經(jīng)過(guò) MySQL 一系列詞法,語(yǔ)法解析等處理后,寫(xiě)入到表 t1,表 t1 的編碼為 C。

那這里編碼 A、編碼 B、編碼 C 如果不兼容,寫(xiě)入的數(shù)據(jù)就直接亂碼。

二、客戶(hù)端亂碼

表數(shù)據(jù)正常,但是客戶(hù)端展示后出現(xiàn)亂碼。

這一類(lèi)場(chǎng)景,指的是從 MySQL 表里拿數(shù)據(jù)出來(lái)返回到客戶(hù)端,MySQL 里的數(shù)據(jù)本身沒(méi)有問(wèn)題??蛻?hù)端發(fā)送請(qǐng)求到 MySQL,表的編碼為 D,從 MySQL 拿到記錄結(jié)果傳輸?shù)娇蛻?hù)端,此時(shí)記錄編碼為 E(CHARACTER_SET_RESULTS)。

那以上編碼 E 和 D 如果不兼容,檢索出來(lái)的數(shù)據(jù)就看起來(lái)亂碼了。但是由于數(shù)據(jù)本身沒(méi)有被破壞,所以換個(gè)兼容的編碼就可以獲取正確的結(jié)果。

這一類(lèi)又分為以下三個(gè)不同的小類(lèi):

1)字段編碼和表一致,客戶(hù)端是不同的編碼

比如下面例子, 表數(shù)據(jù)的編碼是 utf8mb4,而 SESSION 1 發(fā)起的連接編碼為 gbk。那由于編碼不兼容,檢索出來(lái)的數(shù)據(jù)肯定為亂碼。

2)表編碼和客戶(hù)端的編碼一致,但是記錄之間編碼存在不一致的情形

比如表編碼是 utf8mb4,應(yīng)用端編碼也是 utf8mb4,但是表里的數(shù)據(jù)可能一半編碼是 utf8mb4,另外一半是 gbk。那么此時(shí)表的數(shù)據(jù)也是正常的,不過(guò)此時(shí)采用哪種編碼都讀不到所有完整的數(shù)據(jù)。這樣數(shù)據(jù)產(chǎn)生的原因很多,比如其中一種可能性就是表編碼多次變更而且每次變更不徹底導(dǎo)致(變更不徹底,我之前的篇章里有介紹)。舉個(gè)例子,表 t3 的編碼之前是 utf8mb4,現(xiàn)在是 gbk,而且兩次編碼期間都被寫(xiě)入了正常的數(shù)據(jù)。

3)每個(gè)字段的編碼不一致,導(dǎo)致亂碼和第二點(diǎn)一樣的場(chǎng)景。不同的是:非記錄間的編碼不統(tǒng)一,而是每個(gè)字段編碼不統(tǒng)一。舉個(gè)例子,表 c1 字段 a1,a2。a1 編碼 gbk,a2 編碼是 utf8mb4。那每個(gè)字段單獨(dú)讀出來(lái)數(shù)據(jù)是完整的,但是所有字段一起讀出來(lái),數(shù)據(jù)總會(huì)有一部分亂碼。

三、LATIN1

還有一種情形就是以 LATIN1 的編碼存儲(chǔ)數(shù)據(jù)

估計(jì)大家都知道字符集 LATIN1,LATIN1 對(duì)所有字符都是單字節(jié)流處理,遇到不能處理的字節(jié)流,保持原樣,那么在以上兩種存入和檢索的過(guò)程中都能保證數(shù)據(jù)一致,所以 MySQL 長(zhǎng)期以來(lái)默認(rèn)的編碼都是 LATIN1。這種情形,看起來(lái)也沒(méi)啥不對(duì)的點(diǎn),數(shù)據(jù)也沒(méi)亂碼,那為什么還有選用其他的編碼呢?原因就是對(duì)字符存儲(chǔ)的字節(jié)數(shù)不一樣,比如 emoji 字符 "?",如果用 utf8mb4 存儲(chǔ),占用 3 個(gè)字節(jié),那 varchar(12) 就能存放 12 個(gè)字符,但是換成 LATIN1,只能存 4 個(gè)字符。

文章題目:mysql亂碼是怎么回事 mysql亂碼問(wèn)題怎么解決
文章地址:http://muchs.cn/article38/doshhsp.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供云服務(wù)器關(guān)鍵詞優(yōu)化、App開(kāi)發(fā)電子商務(wù)、做網(wǎng)站網(wǎng)頁(yè)設(shè)計(jì)公司

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶(hù)投稿、用戶(hù)轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話(huà):028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

微信小程序開(kāi)發(fā)