Come rimuovere le righe duplicate da un file di testo utilizzando AWK

Mai successo a me ho un set di dati in un file di testo e molte delle stesse linee sono duplicato.

Se il file che ho è abbastanza grande, e inoltre, Ho la necessità di successivamente ordinarlo, la cosa più logica è tradotto Elimina modi di dire duplicato.

Ho bisogno di, Pertanto, un file di testo per inviare tali informazioni, ma che sono state rimosse le righe identiche. Per fare questo, Se stiamo utilizzando un sistema Linux o un Sistema Unix-like, Faremo uso del comando AWK dal possedere Console. Vale a dire, Si può anche fare uso di questo in vostro Sistema Mac OS X.

Si supponga di avere, o creare, un file con il seguenti informazioni:

$ more inicial.txt
Juan
Pedro
Rocio
María
Juan
María
Felipe
Pedro

$ more inicial.txt

Juan

Pedro

Rocio

María

Juan

María

Felipe

Pedro

Per rimuovere le righe duplicate dalla stessa, Chiamiamo il comando AWK nel modo seguente:

awk '!seen[$0]' inicial.txt final.txt

1	awk '!seen[$0]' inicial.txt final.txt

dove Inicial.txt si riferisce al nostro archivio, e Final. txt è il nuovo file che verrà creato non troverai il duplicato di linee del file originale.

Per la eseguirlo e terminare l'esecuzione, Se esaminiamo quali contenuti avete il nuovo file. Final. txt, Possiamo vedere le seguenti:

$ more final.txt
Juan
Pedro
Rocio
María
Felipe

$ more final.txt

Juan

Pedro

Rocio

María

Felipe

Come si può vedere, il nuovo file Mostra le righe differenti, rimozione dei duplicati, file originale.

Lasciaci un commento o accedere allaCose da fare

Tag: AWK, Console o terminale

"Un pensiero su"Come rimuovere le righe duplicate da un file di testo utilizzando AWK”

Juan Carlos Ramirez Fuentes24/02/2018 it 05:01

Supponendo che ho origen.txt e voglio un destino.txt di file
Scrivo il comando awk '!visto[$0]’ Origen.txt destino.txt
Mi mostra le linee (così sembra che lo fa, ma alla fine ottengo sempre questo errore
AWK: linea di ord.:1: fatale: Impossibile aprire il file ' destino.txt’ per la lettura(Nessun file o directory)

Non credete a me il file e non riesco a trovare quello che questa mancanza. L'installazione di Linux Bash alle mie finestre della sonda 10, quindi rimuoverlo e ora estale cygwin

Risposta ↓

I commenti sono chiusi.

Professor Falken - Vedere e sentire la tecnologia che vi circonda

Come rimuovere le righe duplicate da un file di testo utilizzando AWK

Articoli correlati

"Un pensiero su"Come rimuovere le righe duplicate da un file di testo utilizzando AWK”