linux排序命令 linux 排序統(tǒng)計

linux命令之排序命令sort命令

sort命令是對文件進行排序,并將排序的結(jié)果輸出到屏幕,不影響原文件

創(chuàng)新互聯(lián)建站專注于南和企業(yè)網(wǎng)站建設(shè),成都響應(yīng)式網(wǎng)站建設(shè)公司,商城開發(fā)。南和網(wǎng)站建設(shè)公司,為南和等地區(qū)提供建站服務(wù)。全流程按需策劃設(shè)計,專業(yè)設(shè)計,全程項目跟蹤,創(chuàng)新互聯(lián)建站專業(yè)和態(tài)度為您提供的服務(wù)

以行為單位,將每一行作為一個單位,相互比較,比較原則是從首字符向后,以此按ASCII碼進行比較,最后升序輸出

參數(shù)

-b 忽略每行前面開始處的空格

-d 只按照英文字母,數(shù)字,空格字符排序,忽略其他字符

-m 將幾個排序好的文件進行合并

-n 依照數(shù)值的大小進行排序,如果是按照數(shù)值大小排序一定要加 -n ,否則就會出現(xiàn) 10 比2 小的情況,因為默認(rèn)比較數(shù)值是先比較第1位的,后面的位不考慮

-o 將排序好的結(jié)果輸出到文件, 也可以使用重定向符號 輸出到文件中

-r 以相反的順序來排序, 默認(rèn)是升序

每天一個linux命令(1)sort

sort 是將文件的每一行作為一個單位,相互比較,比較原則是從首字符向后,依次按照ASCII碼值進行比較,默認(rèn)將他們按照升序輸出

降序

在輸出中去重

將排序結(jié)果輸出到原文件

sort的默認(rèn)輸出是輸出到標(biāo)準(zhǔn)輸出,如果想把結(jié)果輸出到文件,需要 sort file newfile,但是如果想把結(jié)果輸出到原文件這樣就不行了,這時就需要 使用sort -o

以數(shù)值來排序

sort 默認(rèn)是按照字符串排序的,這樣就會出現(xiàn)10比3小的情況,sort -n 就可以告訴sort 以整數(shù)排序

-t 后面跟 分隔符

-k 后面跟數(shù)字,表示用第幾列排序

如 sort -t : -k 2 表示把每行 以:號分割,按照第二列排序

banana:30:5.5

orange:20:3.4

apple:10:2.5

我們可以看到,當(dāng)baidu 和soho都是100的時候,baidu排在前面,當(dāng)當(dāng)前域按照默認(rèn)規(guī)矩,是從第一個域開始進行升序排序,因此baidu排在了sohu前面。

sort 支持 -k 2 -k3這種模式,如果你需要,你可以繼續(xù)這么寫下去

你仔細(xì)看看,在-k 3后面偷偷加上了一個小寫字母r,r和-r的作用是一樣,你也可以把前面的-n去掉 在r后面加上n,如下

其實-k 選項 功能很強大,語法[ FStart [ .CStart ] ] [ Modifier ] [ , [ FEnd [ .CEnd ] ][ Modifier ] ]

從逗號前后 分為兩大部分,即-k 2,2,是嚴(yán)格使用第一個域排序,如果只設(shè)置-k 2 其實是按照從第一個域到行尾。逗號分開的每部分又有一個點表示子域,即-k 1.2表示 按照第一個域的第二個字符排序,Modifiers就是我們用到的n和r 如 -k 1.2nr 具體我們看下面的例子。

我們使用了-k 1.2,這就表示對第一個域的第二個字符開始到本域的最后一個字符為止的字符串進行排序。你會發(fā)現(xiàn)baidu因為第二個字母是a而名列榜首。sohu和 google第二個字符都是o,但sohu的h在google的o前面,所以兩者分別排在第二和第三。這和之前說到的按照默認(rèn)的排序規(guī)則 是不同的,當(dāng)?shù)谝粋€域的第二個字符相同時,他不會去按照第一個字符排序,而是按照后面的字符排序,這是因為-k 1.2是對第一個域的第二個字符開始到本域的最后一個字符為止的字符串進行排序。而之前的夸域其實是一種假象。

-u只識別用-k設(shè)定的域,發(fā)現(xiàn)相同,就將后續(xù)相同的行都刪除

但是這時候,卻一行也沒有刪除。原來-u是會權(quán)衡所有-k選項,將都相同的才會刪除,只要其中有一級不同都不會輕易刪除的

可以用到b、d、f、i、n 或 r。

其中n和r你肯定已經(jīng)很熟悉了。

b表示忽略本域的簽到空白符號。

d表示對本域按照字典順序排序(即,只考慮空白和字母)。

f表示對本域忽略大小寫進行排序。

i表示忽略“不可打印字符”,只針對可打印字符進行排序。(有些ASCII就是不可打印字符,比如\a是報警,\b是退格,\n是換行,\r是回車等等)

linux命令:du、sort、more、cat、less

一個比較經(jīng)典的問題:

如果線上機器的磁盤占用率超級高,怎么辦?

這時候優(yōu)先想到的肯定是,定位到占用磁盤空間最大的那些文件,然后把可以刪的給刪掉。

那么,問題來了,如何定位到占用磁盤空間最大的文件?

一個辦法是執(zhí)行如下命令:

里面涉及三個指令:du、sort、more

既然用到了,就順便多了解一下這三個指令的用法,算是做下個人筆記。

首先是du

作用:用來查看文件所占用的磁盤情況。

格式:du [選項] [文件]

可用選項(如下為du --help展示的內(nèi)容):

操作示例:

對幾個比較常用的選項單獨拿出來,在機器上實際操作,效果如下:

首先,當(dāng)前目錄如下:

du:

其實吧,從圖里面可以看到,使用“du”的時候,最后一行就當(dāng)前目錄的磁盤使用總量,所以,感覺一般情況下-c這個選項并沒有什么用。

du -s:只計算總量

不過,注意:-s與-a不能同時存在,會報錯的。

sort

作用:對輸出的結(jié)果進行排序

可用選項:

-r:代表逆序排序

-n:按照字符串?dāng)?shù)值排序

-g:按照常規(guī)數(shù)值排序

-f:忽略字母大小寫

實測效果:

首先是測試文件的原始狀態(tài):

測試一:sort

可以發(fā)現(xiàn):

空行排在了第一位;

不管數(shù)字有多大,字符串都會排在數(shù)字的后面;

數(shù)字之間排序的時候,優(yōu)先考慮首位數(shù)字(感覺是把數(shù)字也當(dāng)成了一個字符串進行排序);

more

作用:用于一頁一頁地展示文件內(nèi)容。

幾個常用操作:

空格:翻到下一頁

b:翻到上一頁

/:啟動字符串搜索(類似于vim)

此外:

more +n XXX:從XXX文件的第n行開始展示

more -n XXX:展示XXX文件,并且將n行視為一頁,也就是按空格時,只會顯示后續(xù)的N行

cat

作用:一次性的展示所有文件內(nèi)容

cat有兩個比較有用的選項:

-n:輸出所有行號

-b:只對非空行輸出行號

此外,

cat支持同時輸出多個文件的內(nèi)容:cat XXX YYYY ZZZZ

并且,cat可以與more結(jié)合使用:cat XXX | more 或者 cat XXX YYYY ZZZZ | more 或者 cat -n XXX | more

less:

作用:對文件或者輸出內(nèi)容進行分頁展示,并且less可以用于打開多個文件

常用操作:

j:向上滾動一行

k:向下滾動一行(類似于vim)

g:跳到第一行

G:跳到最后一行

b:向上翻一頁

空格:翻頁

n%:跳轉(zhuǎn)到整個文件的n%處

:e :在使用less打開多個文件時,使用“:e”選擇跳轉(zhuǎn)到其他文件去

/:進行字符串搜索

v:啟動編輯

常用選項:

-N:在每一行前面都顯示行號

-m:顯示讀取文件的百分比

-M:顯示讀取文件的百分比、行號和總行數(shù)

注意:

其他兩個比較簡單的指令:

head:顯示一個文件的前N行

用法:head -n 行數(shù) 文件名

tail:顯示一個文件的最后N行

用法:tail -n 行數(shù) 文件名

不過,使用tai的時候,因為-f選項可以自動顯示新增加的內(nèi)容,所以經(jīng)常會使用如下方式:

tail -f 文件名

分享文章:linux排序命令 linux 排序統(tǒng)計
文章起源:http://muchs.cn/article46/ddccdeg.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供、微信小程序網(wǎng)站改版、云服務(wù)器品牌網(wǎng)站設(shè)計、建站公司

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

成都網(wǎng)站建設(shè)公司