كيفية إزالة الخطوط المكررة من ملف نصي باستخدام AWK

في بعض المناسبات حدث لي أن لدي مجموعة البيانات في ملف نصي والعديد من خطوط منه مكرره.

إذا كان الملف لدي تماما كبيرة, وعلاوة على ذلك, لدي حاجة في وقت لاحق اطلبه, الشيء الأكثر منطقية هو سابقا حذف أقوال مكرره.

احتياج, ولذلك, ملف نصي يقدم تلك المعلومات ولكن تم حذف الصفوف المتطابقة منه. للقيام بذلك, إذا كنا نستخدم نظام لينكس أو نظام شبيه بنظام يونكس, يمكننا الاستفادة من الأمر أوك من الخاصة وحدة التحكم. أي, يمكنك أيضا الاستفادة من هذا في نظام ماك OS X.

لنفترض أنك فعلت, أو إنشاء, أ الملف مع المعلومات التالية:

$ more inicial.txt
Juan
Pedro
Rocio
María
Juan
María
Felipe
Pedro

$ more inicial.txt

Juan

Pedro

Rocio

María

Juan

María

Felipe

Pedro

لإزالة الأسطر المكررة منه, كنا ندعو الأمر أوك بالطريقة التالية:

awk '!seen[$0]' inicial.txt final.txt

1	awk '!seen[$0]' inicial.txt final.txt

حيث الأولي.txt يشير إلى أرشيفنا, و النهائي.txt هو الجديد الملف الذي سيتم إنشاؤه حيث لن يتم العثور على أسطر مكررة من الملف الأصلي.

لأن وتشغيلها ووضع اللمسات الأخيرة على تنفيذه, إذا تحققنا من المحتوى الذي يحتوي عليه الملف الجديد النهائي.txt, يمكننا أن نرى ما يلي:

$ more final.txt
Juan
Pedro
Rocio
María
Felipe

$ more final.txt

Juan

Pedro

Rocio

María

Felipe

كما يمكنك مشاهدة, يعرض الملف الجديد الصفوف المختلفة, إزالة التكرارات, من الملف الأصلي.

ترك لنا تعليق أو أدخلالمنتدى

العلامات: أوك, المحطة الطرفية أو وحدة التحكم

المواد ذات الصلة

كيفية البحث عن الملفات عن طريق المحطة الطرفية لينكس

كيفية تغيير المنطقة الزمنية من المحطة الطرفية لينكس

كيف يمكنني أن أعرف بمجال بيانات DNS

كيفية عرض نموذج وسرعة جهاز الكمبيوتر الخاص بك في لينكس

"يفكر أحد في"كيفية إزالة الخطوط المكررة من ملف نصي باستخدام AWK”

خوان كارلوس راميريز فوينتس24/02/2018 أون 05:01

على افتراض أن لدي مصدر.txt وأريد ملف الوجهة.txt
اكتب الأمر awk '!رايت[$0]’ الأصل.txt الوجهة.txt
انها تتكشف خطوط (لذلك يبدو أن تفعل ذلك, ولكن في النهاية أحصل دائما على هذا الخطأ
أوك: خط ord.:1: قاتل: غير قادر على فتح الملف 'الوجهة.txt’ للقراءة(لا يوجد مثل هذا الملف أو الدليل)

لا أصدق الملف ولا أجد ما يخذلني. محاولة تثبيت لينكس باش إلى ويندوز بلدي 10, ثم إزالته والآن يكون cygwin

الرد ↓

التعليقات مغلقة.