
曾经发生在我身上我有 数据集 在 文件的文本 和许多相同的行 重复.
如果文件是相当 大, 此外, 我有到随后的需要 订购, 最符合逻辑的事是以前 删除 语录 重复.
我需要, 因此, 提交此类信息的文本文件,但现已删除相同的行. 要做到这一点, 如果您使用的系统 Linux 或 Unix 系统, 我们将使用的命令 AWK 从自己 控制台. 即, 您还可以使用这样的你 Mac OS X 系统.
假设你有, 或创建, 一个 文件 与 以下信息:
1 2 3 4 5 6 7 8 9 | $ more inicial.txt Juan Pedro Rocio María Juan María Felipe Pedro |
从同一删除重复的行, 我们将调用的命令 AWK 通过以下方式:
1 | awk '!seen[$0]' inicial.txt final.txt |
在哪里 inicial.txt 我们的档案是指, 和 final.txt 是新的 要创建文件 在原始文件中的重复行不会被发现.
到 运行它 和结束其执行, 如果我们审查哪些内容有了新的文件 final.txt, 我们可以看到以下内容:
1 2 3 4 5 6 | $ more final.txt Juan Pedro Rocio María Felipe |
正如你可以看到, 新的文件显示不同的行, 删除重复项, 原始文件.

我们的留言或输入到论坛
"一个想法"如何从文本文件中使用 AWK 删除重复行”
假设我有 origen.txt, 我想要一个文件 destino.txt
我写下命令 awk!见过[$0]’ origen.txt destino.txt
它显示了我的线条 (所以它似乎, 但最后我总是得到这个错误
AWK: 奥德线。:1: 致命: 无法打开文件 "destino.txt’ 用于阅读(没有这样的文件或目录)
不要相信我的文件, 我无法找到我这个失败. 在我的窗口中安装 Linux Bash 的探测器 10, 然后删除它, 现在房地产 cygwin