代码之家 › 专栏 › 技术社区 › geeb.24

使用Awk消除基于两列的重复行

awk bash

geeb.24 · 技术社区 · 7 年前

鉴于此输入:

#       133        15
KBL  40.385  26.385 1.0000 S
KBL  23.846   9.289 1.0000 P
KBL  40.234  26.385 1.0000 S
#       133         4
KBL  40.234  28.566 1.0000 S
KBL  40.385  28.566 1.0000 S
KBL  23.846  12.032 1.0000 P

#       133        15
KBL  40.385  26.385 1.0000 S
KBL  23.846   9.289 1.0000 P
#       133         4
KBL  40.234  28.566 1.0000 S
KBL  23.846  12.032 1.0000 P

我试过了 awk '!a[$0]++' file.xy . 但是,这只会删除完全相同的行。我只想删除在第二列或第三列中有重复值的行。

2 回复 | 直到 7 年前

Ed Morton 7 年前

# -行分隔块:

$ awk '/^#/{print; delete seen; next} !(seen[$2]++ || seen[$3]++)' file
#       133        15
KBL  40.385  26.385 1.0000 S
KBL  23.846   9.289 1.0000 P
#       133         4
KBL  40.234  28.566 1.0000 S
KBL  23.846  12.032 1.0000 P

Ashutosh 7 年前

awk '!a[$2]++ || !a[$3]++' file1.txt > file2.txt && awk '!a[$3]++' file2.txt

产生的结果是:

#       133        15
KBL  40.385  26.385 1.0000 S
KBL  23.846   9.289 1.0000 P
#       133         4
KBL  40.234  28.566 1.0000 S
KBL  23.846  12.032 1.0000 P

推荐文章

mashimena · 如何在Linux中提取列然后通过计算添加新列

2 年前

user2954003 · AWK使用正则表达式匹配字符串并与前一个字符串组合

4 年前

Giancarlo D · 在IPv4地址匹配后使用SED删除行尾的冒号

4 年前

John Smith · 在特定行的末尾添加文本

4 年前

Code With Banchi · 在sed命令中使用变量-sed-e异常:“s”的选项未知

4 年前

Aravinth Kalai · 如何使用Linux shell命令[duplicate]对两列求和并将值保存到第三列

4 年前

nickcrv06 · 使用介于特殊字符之间的awk提取文本

4 年前

nickcrv06 · 在两个常量字符串之间提取单词

4 年前

JCAvila2 · 我需要了解awk Linux命令的帮助

4 年前

sasikumar karuppiah · Awk脚本提取多个不同的分隔符行

4 年前