linuxenca命令 enca 命令

linux查看文件編碼命令

1,使用file 命令查看文件的編碼格式

創(chuàng)新互聯(lián)主要從事成都做網(wǎng)站、網(wǎng)站建設(shè)、外貿(mào)營(yíng)銷(xiāo)網(wǎng)站建設(shè)、網(wǎng)頁(yè)設(shè)計(jì)、企業(yè)做網(wǎng)站、公司建網(wǎng)站等業(yè)務(wù)。立足成都服務(wù)新寧,10余年網(wǎng)站建設(shè)經(jīng)驗(yàn),價(jià)格優(yōu)惠、服務(wù)專(zhuān)業(yè),歡迎來(lái)電咨詢(xún)建站服務(wù):13518219792

[root@dep-184 /]# file 1.txt

1.txt: ISO-8859 text

2,vim 命令

使用vim命令進(jìn)入文件 1.txt,然后在使用 “:set fileencoding” 查看文件當(dāng)前展示的編碼格式(這里必須確保展示內(nèi)容無(wú)亂碼,才可以得到內(nèi)容真實(shí)的編碼格式)

3,enca命令 《Linux就該這么學(xué)》

使用enca可以直接查看文件內(nèi)容的編碼格式,如下

[root@dep-184 /]# enca 1.txt

Simplified Chinese National Standard; GB2312

linux 怎么檢測(cè)文件名的編碼格式

首先我們打開(kāi)系統(tǒng)并使用root賬戶(hù)登錄系統(tǒng)。然后使用命令“file -i /opt/test.log”來(lái)查看test.log的文件編碼格式。具體展示如下圖所示。

下面我們介紹命令iconv的命令的用法,首先我們查看幫助文檔。執(zhí)行命令“iconv --help”查看幫助文檔。具體如下圖所示。

下面詳細(xì)介紹各個(gè)參數(shù)的含義。

-f encoding 表示原始文件的字符編碼。

-t encoding 表示輸出文件的字符編碼。

-l 表示列舉所有已知的字符集。

-c 表示從輸出中忽略無(wú)效的字符

-o filename 表示輸出文件

-s 表示關(guān)閉警告。

--verbose 表示顯示進(jìn)度信息。

下面我們執(zhí)行命令“iconv -l”查看支持的所有的字符編碼格式。具體展示如下圖所示。

下面我們簡(jiǎn)單用下如何轉(zhuǎn)換,將上面我們查看的test.log的字符編碼轉(zhuǎn)化為UTF-8編碼,并且重新輸出到test1.log。我們使用命令“iconv test.log -f iso-8859-1 -t UTF-8 -o test1.log --verbose”具體展示如下圖所示。

最后我們驗(yàn)證轉(zhuǎn)化后的test1.log的字符編碼。我們執(zhí)行命令"file -i /opt/test1.log"查看字符編碼,可以看到已經(jīng)轉(zhuǎn)化為utf-8了。

linux下文件編碼格式轉(zhuǎn)換方法(gb18030/utf-8)

linux下文件編碼格式轉(zhuǎn)換方法(gb18030/utf-8)

在 Linux 做開(kāi)發(fā)或者系統(tǒng)管理遇到亂碼是經(jīng)常的事情,主要windows下中文的默認(rèn)編碼是bg2312,而 linux下是utf-8。很多時(shí)候 涉及到和windows平臺(tái)系統(tǒng)的通信免不了編碼的轉(zhuǎn)化,可能大部分人都用iconv庫(kù)函數(shù)(包含在glib中)和iconv命令來(lái)執(zhí)行編碼轉(zhuǎn)換,即:

iconv -f gb18030 -t utf-8 file1.txt -o file2.txt

說(shuō)實(shí)話(huà)這個(gè)命令不好使,一方面容易重復(fù)轉(zhuǎn)換,另一方面不支持通配符,無(wú)法成批轉(zhuǎn) 換,文件少了還好說(shuō),要是一大堆文件豈不是要累死?

今天我要推薦的是另一個(gè) Shell 下編碼轉(zhuǎn)換工具enca。用它不僅可以轉(zhuǎn)換編碼,還可以查看文件的原始編碼,而且還支持成批轉(zhuǎn)換。使用上也比iconv方便一些。安裝enca很簡(jiǎn)單,一般用源安裝就行了,enca用法如下:

enca -L 當(dāng)前語(yǔ)言 文件名

enca -L zh_CN file //檢查文件的編碼

enca -L 當(dāng)前語(yǔ)言 -x 目標(biāo)編碼 文件名

enca -L zh_CN -x UTF-8 file //將文件編碼轉(zhuǎn)換為”UTF-8″編碼

enca -L zh_CN -x UTF-8 file1 file2 //如果不想覆蓋原文件可以這樣

除了有檢查文件編碼的功能以外,”enca”還有一個(gè)好處就是如果文件本來(lái)就是你要轉(zhuǎn)換的那種編碼,它不會(huì)報(bào)錯(cuò),還是會(huì)print出結(jié)果來(lái), 而”iconv”則會(huì)報(bào)錯(cuò)。這對(duì)于腳本編寫(xiě)是比較方便的事情。

Linux 文本文件編碼轉(zhuǎn)換工具

本文介紹兩款文件編碼轉(zhuǎn)換工具,系統(tǒng)環(huán)境 Kali Linux 2.0,其他發(fā)行版類(lèi)同

安裝方法:

命令格式:

例: 把當(dāng)前目錄的文件都轉(zhuǎn)成 utf-8

更多用法請(qǐng)查看幫助 enca --help

命令格式:

當(dāng)前編碼可以通過(guò) file 查看

但是有時(shí)候我們可能的到的結(jié)果是:

這種情況下編碼就不好確定了,下面記下的兩條第一條是我自己轉(zhuǎn)換過(guò)的文件用的,第二條是從網(wǎng)上搜到有人解決問(wèn)題的編碼。 如果是 Non-ISO 類(lèi)型,下面的內(nèi)容僅供參考,更多使用方法請(qǐng)查看 help 和 搜索引擎

linux下如何判斷文本的字符集編碼

在Linux中查看文件編碼可以通過(guò)以下幾種方式:1.在Vim中可以直接查看文件編碼:set fileencoding,即可顯示文件編碼格式。2. enca (如果你的系統(tǒng)中沒(méi)有安裝這個(gè)命令,可以用sudo yum install -y enca 安裝 )查看文件編碼

下面介紹一下,在 Linux 中如何查看文件的編碼及如何進(jìn)行對(duì)文件進(jìn)行編碼轉(zhuǎn)換。

一,查看文件編碼: 在 Linux 中查看文件編碼可以通過(guò)以下幾種方式:

1.在 Vim 中可以直接查看文件編碼 :set fileencoding 即可顯示文件編碼格式。 如果你只是想查看其它編碼格式的文件或者想解決用 Vim 查看文件亂 碼的問(wèn)題,那么你可以在 ~/.vimrc 文件中添加以下內(nèi)容: set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936 這樣, 就可以讓 vim 自動(dòng)識(shí)別文件編碼 (可以自動(dòng)識(shí)別 UTF-8或者 GBK 編碼的文件) ,其實(shí)就是依照 fileencodings 提供的編碼列表嘗試,如 果沒(méi)有找到合適的編碼,就用 latin-1(ASCII)編碼打開(kāi)。

2. enca (如果你的系統(tǒng)中沒(méi)有安裝這個(gè)命令,可以用 sudo yum install -y enca 安裝 )查看文件編碼 $ enca filename filename: Universal transformation format 8 bits; UTF-8 CRLF line terminators 需要說(shuō)明一點(diǎn)的是,enca 對(duì)某些 GBK 編碼的文件識(shí)別的不是很好,識(shí) 別時(shí)會(huì)出現(xiàn): Unrecognized encoding

二,文件編碼轉(zhuǎn)換

1.在 Vim 中直接進(jìn)行轉(zhuǎn)換文件編碼,比如將一個(gè)文件轉(zhuǎn)換成 utf-8格式 :set fileencoding=utf-8 2. iconv 轉(zhuǎn)換,iconv 的命令格式如下:輸入/輸出格式規(guī)范: -f, --from-code=名稱(chēng) 原始文本編碼 -t, --to-code=名稱(chēng) 輸出編碼 信息: -l, --list 列舉所有已知的字符集 輸出控制: -c 從輸出中忽略無(wú)效的字符 -o, --output=FILE 輸出文件 Svn8.Com -s, --s ilent 關(guān)閉警告 --verbose 打印進(jìn)度信息 -?, --help 給出該系統(tǒng)求助列表 --usage 給出簡(jiǎn)要的用法信息 -V, --version 打印程序版本號(hào) 例子: iconv -f utf-8 -t gb2312 aaa.txt bbb.txt 這個(gè)命令讀取 aaa.txt 文件,從 utf-8編碼轉(zhuǎn)換為 gb2312編碼,其輸出定向到 bbb.txt文件。 iconv -f encoding -t encoding inputfile 比如將一個(gè) UTF-8 編碼的文件轉(zhuǎn)換成 GBK 編碼 iconv -f GBK -t UTF-8 file1 -o file2

3. enconv 轉(zhuǎn)換文件編碼 比如要將一個(gè) GBK 編碼的文件轉(zhuǎn)換成 UTF-8編碼,操作如下 enconv -L zh_CN -x UTF-8 filename

linux查看文件編碼格式命令

i).在 Vim 中可以直接查看文件編碼(shift + :)輸入set fileencoding 即可顯示文件編碼格式。

如果你只是想查看其它編碼格式的文件或者想解決用 Vim 查看文件亂碼的問(wèn)題,那么你可以在 ~/.vimrc 文件中添加以下內(nèi)容: set

encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936 這樣, 就可以讓 vim 自動(dòng)識(shí)別文件編碼

(可以自動(dòng)識(shí)別 UTF-8或者 GBK 編碼的文件) ,其實(shí)就是依照 fileencodings

提供的編碼列表嘗試,如果沒(méi)有找到合適的編碼,就用 latin-1(ASCII)編碼打開(kāi)。

ii). enca (需要安裝)查看文件編碼:$enca filename filename: Universal

transformation format 8 bits; UTF-8 CRLF line terminators 需要說(shuō)明一點(diǎn)的是,enca

對(duì)某些 GBK 編碼的文件識(shí)別的不是很好,識(shí)別時(shí)會(huì)出現(xiàn): Unrecognized encoding

iii)還有一種很簡(jiǎn)單的方式,file 文件名 可以查看非elf文件的編碼格式

名稱(chēng)欄目:linuxenca命令 enca 命令
網(wǎng)站地址:http://muchs.cn/article46/hgsihg.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站收錄、網(wǎng)站建設(shè)企業(yè)網(wǎng)站制作、網(wǎng)站改版、網(wǎng)站內(nèi)鏈、標(biāo)簽優(yōu)化

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶(hù)投稿、用戶(hù)轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀(guān)點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話(huà):028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

成都網(wǎng)站建設(shè)