如何从文本文件中使用 AWK 删除重复行

曾经发生在我身上我有 数据集 在 文件的文本 和许多相同的行重复.

如果文件是相当大, 此外, 我有到随后的需要订购, 最符合逻辑的事是以前删除语录重复.

我需要, 因此, 提交此类信息的文本文件，但现已删除相同的行. 要做到这一点, 如果您使用的系统 Linux 或 Unix 系统, 我们将使用的命令 AWK 从自己 控制台. 即, 您还可以使用这样的你 Mac OS X 系统.

假设你有, 或创建, 一个文件与 以下信息:

$ more inicial.txt
Juan
Pedro
Rocio
María
Juan
María
Felipe
Pedro

$ more inicial.txt

Juan

Pedro

Rocio

María

Juan

María

Felipe

Pedro

从同一删除重复的行, 我们将调用的命令 AWK 通过以下方式:

awk '!seen[$0]' inicial.txt final.txt

1	awk '!seen[$0]' inicial.txt final.txt

在哪里 inicial.txt 我们的档案是指, 和 final.txt 是新的 要创建文件 在原始文件中的重复行不会被发现.

到 运行它 和结束其执行, 如果我们审查哪些内容有了新的文件 final.txt, 我们可以看到以下内容:

$ more final.txt
Juan
Pedro
Rocio
María
Felipe

$ more final.txt

Juan

Pedro

Rocio

María

Felipe

正如你可以看到, 新的文件显示不同的行, 删除重复项, 原始文件.

我们的留言或输入到论坛

标签: AWK, 控制台或终端

"一个想法"如何从文本文件中使用 AWK 删除重复行”

胡安. 范托斯24/02/2018 en 05:01

假设我有 origen.txt, 我想要一个文件 destino.txt
我写下命令 awk!见过[$0]’ origen.txt destino.txt
它显示了我的线条 (所以它似乎, 但最后我总是得到这个错误
AWK: 奥德线。:1: 致命: 无法打开文件 "destino.txt’ 用于阅读(没有这样的文件或目录)

不要相信我的文件, 我无法找到我这个失败. 在我的窗口中安装 Linux Bash 的探测器 10, 然后删除它, 现在房地产 cygwin

答复 ↓

注释已关闭.

教授 Falken - 看到和感受到的技术，围绕着你

如何从文本文件中使用 AWK 删除重复行

相关的文章

"一个想法"如何从文本文件中使用 AWK 删除重复行”