AWK का उपयोग कर एक पाठ फ़ाइल से डुप्लिकेट पंक्तियों को निकालने के लिए कैसे

मुझे कभी नहीं हुआ है मैं एक डेटा सेट में एक पाठ फ़ाइल और उसी की तर्ज की कई हैं डुप्लिकेट.

यदि फ़ाइल है कि मैं काफी है बड़े, और इसके अलावा, मैं बाद में करने के लिए की जरूरत है यह आदेश, पहले सबसे तार्किक बात है हटाएँ कहावतें डुप्लिकेट.

मैं की जरूरत है, इसलिए, ऐसी जानकारी सबमिट करने के लिए एक पाठ फ़ाइल लेकिन जो किया गया है समान पंक्तियाँ निकाल दी. ऐसा करने के लिए, यदि आप एक सिस्टम का उपयोग कर रहे हैं लिनक्स या एक यूनिक्स की तरह सिस्टम, हम कर देगा का आदेश का उपयोग करें AWK खुद से कंसोल. यानी, आप भी कर सकते हैं में इस का उपयोग करें अपने मैक ओएस एक्स सिस्टम.

मान लीजिए कि आप है, या बनाएँ, एक फ़ाइल के साथ निम्न जानकारी:

$ more inicial.txt
Juan
Pedro
Rocio
María
Juan
María
Felipe
Pedro

$ more inicial.txt

Juan

Pedro

Rocio

María

Juan

María

Felipe

Pedro

उसी से डुप्लिकेट पंक्तियों को निकालने के लिए, हम आदेश कहोगे AWK निम्नलिखित तरीके में:

awk '!seen[$0]' inicial.txt final.txt

1	awk '!seen[$0]' inicial.txt final.txt

जहाँ inicial.txt हमारे संग्रह करने के लिए संदर्भित करता है, और final.txt नया है बनाया जा करने के लिए फ़ाइल जहां मूल फ़ाइल से डुप्लिकेट पंक्तियाँ मिल जाएगा नहीं.

करने के लिए इसे चलाएँ और अंत में इसका निष्पादन, हम क्या सामग्री की समीक्षा करें, यदि आप नई फ़ाइल है final.txt, हम निम्न देख सकते हैं:

$ more final.txt
Juan
Pedro
Rocio
María
Felipe

$ more final.txt

Juan

Pedro

Rocio

María

Felipe

जैसा कि आप देख सकते हैं, नई फ़ाइल अलग पंक्तियों से पता चलता है, डुप्लिकेट्स को निकालने, मूल फ़ाइल.

हमें एक टिप्पणी छोड़ दो या करने के लिए दर्ज करेंफोरम

टैग: AWK, कंसोल या टर्मिनल

"एक पर सोचा"AWK का उपयोग कर एक पाठ फ़ाइल से डुप्लिकेट पंक्तियों को निकालने के लिए कैसे”

Juan Carlos Ramírez Fuentes24/02/2018 एन 05:01

Suponiendo que tengo origen.txt y quiero un archivo destino.txt
Escribo el comando awk ‘!देखा[$0]’ origen.txt destino.txt
Me despliega las lineas (así que parece que lo hace, pero al final siempre me sale este error
AWK: línea ord.:1: fatal: no se puede abrir el fichero `destino.txt’ para lectura(कोई फ़ाइल या निर्देशिका)

No me crea el archivo y no puedo encontrar que es lo que me esta fallando. Probe instalando Bash de Linux a mi windows 10, luego lo quite y ahora estale cygwin

उत्तर दें ↓

टिप्पणियां बंद हो जाती है.

प्रोफेसर Falken - देखते हैं और प्रौद्योगिकी है कि आप चारों ओर से घेरे महसूस

AWK का उपयोग कर एक पाठ फ़ाइल से डुप्लिकेट पंक्तियों को निकालने के लिए कैसे

संबंधित लेख

"एक पर सोचा"AWK का उपयोग कर एक पाठ फ़ाइल से डुप्लिकेट पंक्तियों को निकालने के लिए कैसे”