
En alguna ocasión me ha ocurrido que tengo un مجموعة البيانات في archivo de texto y muchas de las líneas del mismo están duplicadas.
Si el archivo que tengo es bastante كبيرة, وعلاوة على ذلك, tengo la necesidad de posteriormente ordenarlo, lo más lógico es previamente حذف أقوال duplicados.
Necesito, ولذلك, un archivo de texto que presente dicha información pero del cual se hayan eliminado las filas idénticas. للقيام بذلك, si estamos usando un sistema لينكس أو sistema Unix-like, podremos hacer uso del comando awk من الخاصة وحدة التحكم. أي, también puedes hacer uso de esto en tu sistema Mac OS X.
Supongamos que tienes, o creas, أ الملف مع siguiente información:
1 2 3 4 5 6 7 8 9 | $ more inicial.txt Juan Pedro Rocio María Juan María Felipe Pedro |
Para eliminar las líneas duplicadas del mismo, llamaríamos al comando awk بالطريقة التالية:
1 | awk '!seen[$0]' inicial.txt final.txt |
حيث inicial.txt hace referencia a nuestro archivo, و final.txt es el nuevo archivo que se creará donde no se encontrarán las líneas duplicadas del archivo original.
لأن وتشغيلها y finalizar su ejecución, si revisamos qué contenido tiene el nuevo archivo final.txt, podemos ver lo siguiente:
1 2 3 4 5 6 | $ more final.txt Juan Pedro Rocio María Felipe |
كما يمكنك مشاهدة, el nuevo archivo muestra las diferentes filas, eliminando los duplicados, del archivo original.
"يفكر أحد في"كيفية إزالة الخطوط المكررة من ملف نصي باستخدام AWK”
Suponiendo que tengo origen.txt y quiero un archivo destino.txt
Escribo el comando awk ‘!seen[$0]’ origen.txt destino.txt
Me despliega las lineas (así que parece que lo hace, pero al final siempre me sale este error
awk: línea ord.:1: fatal: no se puede abrir el fichero `destino.txt’ para lectura(لا يوجد مثل هذا الملف أو الدليل)
No me crea el archivo y no puedo encontrar que es lo que me esta fallando. Probe instalando Bash de Linux a mi windows 10, luego lo quite y ahora estale cygwin