四種常見文本文件編碼方式ANSI編碼:無文件頭(文件編碼開頭標(biāo)志性)

2023-12-01    分類: 網(wǎng)站建設(shè)

php字符編碼轉(zhuǎn)換類,支持ANSI、big、UTF-8、UTF-8+bom相互轉(zhuǎn)換。

四種常見的文本文件編碼方式

ANSI 編碼:

無文件頭(文件編碼開頭的有效字節(jié))

ANSI編碼的字母數(shù)字占一個(gè)字節(jié),漢字占兩個(gè)字節(jié)

回車換行,單字節(jié),十六進(jìn)制表示為0d 0a

編碼:

文件頭,十六進(jìn)制表示為FF FE

每個(gè)字符用兩個(gè)字節(jié)編碼

回車,換行,雙字節(jié),十六進(jìn)制表示為000d 000a

大編碼:

文件頭的十六進(jìn)制表示為FE FF

后面的編碼就是把字符的高位放在前面,低位放在后面,正好是編碼的逆過程

回車,換行php轉(zhuǎn)unicode編碼,雙字節(jié)php轉(zhuǎn)unicode編碼,十六進(jìn)制表示為 0d00 0a00

UTF-8 編碼:

文件頭,十六進(jìn)制表示為EF bb bF

UTF-8 是一種可變長(zhǎng)度的字符編碼。數(shù)字、字母、回車、換行都用1個(gè)字節(jié)表示,漢字占3個(gè)字節(jié)。

回車換行,單字節(jié),十六進(jìn)制表示為0d 0a

轉(zhuǎn)換原則:先將字符編碼轉(zhuǎn)換為UTF-8,再由UTF-8轉(zhuǎn)換為對(duì)應(yīng)的字符編碼。

..php

_allow_charset)){
            $this->_in_charset = $in_charset;
        }
        // 檢查輸出編碼
        if(in_array($out_charset, $this->_allow_charset)){
            $this->_out_charset = $out_charset;
        }
    }
    /** 轉(zhuǎn)換
    * @param  String $str 要轉(zhuǎn)換的字符串
    * @return String      轉(zhuǎn)換后的字符串
    */
    public function convert($str){
        $str = $this->convToUtf8($str);   // 先轉(zhuǎn)為utf8
        $str = $this->convFromUtf8($str); // 從utf8轉(zhuǎn)為對(duì)應(yīng)的編碼
        return $str;
    }
    /** 把編碼轉(zhuǎn)為UTF-8編碼
    * @param  String $str 
    * @return String
    */
    private function convToUtf8($str){
        if($this->_in_charset=='utf-8'){ // 編碼已經(jīng)是utf-8,不用轉(zhuǎn)
            return $str;
        }
        switch($this->_in_charset){
            case 'utf-8bom':
                $str = substr($str, 3);
                break;
            case 'ansi':
                $str = iconv('GbK', 'UTF-8//IGNORE', $str);
                break;
            case 'unicode':
                $str = iconv('UTF-16le', 'UTF-8//IGNORE', substr($str, 2));
                break;
            case 'unicodebe':
                $str = iconv('UTF-16be', 'UTF-8//IGNORE', substr($str, 2));
                break;
            default:
                break;
        }
        return $str;
    }
    /** 把UTF-8編碼轉(zhuǎn)換為輸出編碼
    * @param  String $str
    * @return String
    */
    private function convFromUtf8($str){
        if($this->_out_charset=='utf-8'){ // 輸出編碼已經(jīng)是utf-8,不用轉(zhuǎn)
            return $str;
        }
        switch($this->_out_charset){
            case 'utf-8bom':
                $str = "\xef\xbb\xbf".$str;
                break;
            case 'ansi':
                $str = iconv('UTF-8', 'GbK//IGNORE', $str);
                break;
            case 'unicode':
                $str = "\xff\xfe".iconv('UTF-8', 'UTF-16le//IGNORE', $str);
                break;
            case 'unicodebe':
                $str = "\xfe\xff".iconv('UTF-8', 'UTF-16be//IGNORE', $str);
                break;
            default:
                break;
        }
        return $str;
    }
} // class end
?>

演示:將 big 轉(zhuǎn)換為 utf-8+bom

convert($str);
file_put_contents('response/utf-8bom.txt', $response, true);
?>

源碼下載地址:點(diǎn)擊查看

以上介紹了pHp字符編碼轉(zhuǎn)換類,支持ANSI、big、UTF-8、UTF-8+bom之間的轉(zhuǎn)換,包括內(nèi)容,希望對(duì)pHp教程感興趣的朋友有所幫助.

免責(zé)聲明:本文首發(fā)于php中文網(wǎng)。轉(zhuǎn)載請(qǐng)注明出處。感謝您的尊重!如果您有任何問題,請(qǐng)聯(lián)系我們

網(wǎng)頁題目:四種常見文本文件編碼方式ANSI編碼:無文件頭(文件編碼開頭標(biāo)志性)
當(dāng)前地址:http://www.muchs.cn/news48/297848.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供小程序開發(fā)Google、網(wǎng)站建設(shè)電子商務(wù)、面包屑導(dǎo)航、移動(dòng)網(wǎng)站建設(shè)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

商城網(wǎng)站建設(shè)