Ordonner une liste et supprimer les doublons
Vous êtes en possession d’une liste donnée, et souhaitez supprimer les doublons, rapidement et simplement ?
Une des solutions, libre et efficace, est d’utiliser Notepad++ [1], un éditeur de texte libre, mais aussi léger, proposant de nombreuses fonctionnalités intéressantes :
- l’ouverture de fichiers en onglets,
- coloration syntaxique (les fichiers dans un format détécté sont colorés),
- possibilité d’annuler un grand nombre d’opérations,
- suppression des doublons,
- comparaison de plusieurs fichiers, …
Il vous faudra de plus vous munir du plugin TextFX. Pour ce faire, rendez-vous sur SourceForge [2], et téléchargez la dernière version du plugin (Fig 10). Il vous suffit ensuite d’extraire l’archive téléchargée dans votre dossier d’installation de Notepad++ (Fig 11).
Une fois Notepad++ lancé, vous pouvez avoir un fichier contenant des doublons (Fig 1).
Pour supprimer ceux-ci, dans un premier temps, vérifiez que l’option « +Sort outputs only UNIQUE (at column) lines » (Fig 2) est sélectionnée, puis sélectionnez vos données (Fig 3).
Ensuite, deux possibilités s’offrent à vous :
- supprimer les doublons sans tenir compte de la casse (Fig 4), avec pour résultat les lignes contenant les mêmes lettres que d’autres supprimées (Fig 5),
- supprimer les doublons en tenant compte de la casse (Fig 6), avec pour résultat les lignes totalement identiques à d’autres supprimées (Fig 7).
Vous pouvez ensuite, avec les deux listes créées, et après les avoir collées dans deux fichiers différents, les comparer (Fig 8), avec, pour résultat, l’affichage dans le premier fichier des lignes n’existant pas dans le second fichier, et, dans le second, l’affichage des lignes qui n’existent pas dans le premier fichier (Fig 9).
Lecture sur le sujet
Liens et crédits
- [1] – Notepad++, éditeur de texte complet – http://notepad-plus-plus.org/
- [2] – Notepad++ TextFX plugin sur SourceForge – http://sourceforge.net
Images
- Fig1 : Notepad++ file with duplicates
- Fig2 : Notepad++ sort unique
- Fig3 : Notepad++ select data
- Fig4 : Notepad++ sort case insensitive
- Fig5 : Notepad++ duplicate lines removed
- Fig6 : Notepad++ sort case sensitive
- Fig7 : Notepad++ identical lines removed
- Fig8 : SENotepad++ compare files
- Fig9 : Notepad++ compare results
- Fig10 : TextFX Plugin download on SourceForge
- Fig11 : Plugin installation for Notepad++
Vos images sont en 404
Merci pour votre retour, le problème devrait à présent être résolu