Linux命令 comm - 按行比較兩個(gè)已排序的文件。

2021-10-27 11:43 更新

comm

按行比較兩個(gè)已排序的文件。

概要

comm [OPTION]... FILE1 FILE2

主要用途

  • 按行比較兩個(gè)已排序的文件。
  • 當(dāng)FILE1或FILE2為-時(shí),讀取標(biāo)準(zhǔn)輸入。
  • 無選項(xiàng)時(shí)輸出三列,第一列為FILE1獨(dú)有的行,第二列為FILE2獨(dú)有的行,第三列為FILE1,F(xiàn)ILE2共有的行。

選項(xiàng)

-1                        不輸出第一列。
-2                        不輸出第二列。
-3                        不輸出第三列。
--check-order             檢查輸入行是否正確的排序,即使它們確實(shí)是已排序過的。
--nocheck-order           不檢查輸入行是否正確的排序。
--output-delimiter=STR    使用STR作為輸出列之間的分隔符而不是默認(rèn)的TAB。
--total                   額外地增加第四列輸出概要。
-z, --zero-terminated     設(shè)置行終止符為NUL(空),而不是換行符。
--help                    顯示幫助信息并退出。
--version                 顯示版本信息并退出。

返回值

返回0表示成功,返回非0值表示失敗。

例子

文本 aaa.txt 內(nèi)容

[root@localhost text]# cat aaa.txt 
aaa
bbb
ccc
ddd
eee
111
222

文本 bbb.txt 內(nèi)容

[root@localhost text]# cat bbb.txt 
bbb
ccc
aaa
hhh
ttt
jjj

比較結(jié)果

[root@localhost text]# comm --nocheck-order aaa.txt bbb.txt 
aaa
                bbb
                ccc
        aaa
ddd
eee
111
222
        hhh
        ttt
        jjj

輸出的第一列只包含在aaa.txt中出現(xiàn)的行,第二列包含在bbb.txt中出現(xiàn)的行,第三列包含在aaa.txt和bbb.txt中相同的行。各列之間以制表符(\t)作為分隔符。

比較排序過的文檔

先通過 sort 將文件內(nèi)容排序:

[root@localhost ~]# sort aaa.txt > aaa1.txt
[root@localhost ~]# sort bbb.txt > bbb1.txt

比較結(jié)果:

[root@localhost ~]# comm aaa1.txt bbb1.txt
111
222
		aaa
		bbb
		ccc
ddd
eee
	hhh
	jjj
	ttt

交集

打印兩個(gè)文件的交集,需要?jiǎng)h除第一列和第二列:

[root@localhost text]# comm aaa.txt bbb.txt -1 -2
bbb
ccc

差集

通過刪除不需要的列,可以得到aaa.txt和bbb.txt的差集:

aaa.txt的差集

[root@localhost text]# comm aaa.txt bbb.txt -2 -3
aaa
ddd
eee
111
222

bbb.txt的差集

[root@localhost text]# comm aaa.txt bbb.txt -1 -3
aaa
hhh
ttt
jjj

注意

  1. 該命令是GNU coreutils包中的命令,相關(guān)的幫助信息請查看man -s 1 comm,info coreutils 'comm invocation'。


以上內(nèi)容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)