Divers

Ordonner une liste et supprimer les doublons

Vous êtes en possession d’une liste donnée, et souhaitez supprimer les doublons, rapidement et simplement ?

Une des solutions, libre et efficace, est d’utiliser Notepad++ [1], un éditeur de texte libre, mais aussi léger, proposant de nombreuses fonctionnalités intéressantes :

  • l’ouverture de fichiers en onglets,
  • coloration syntaxique (les fichiers dans un format détécté sont colorés),
  • possibilité d’annuler un grand nombre d’opérations,
  • suppression des doublons,
  • comparaison de plusieurs fichiers, …

Il vous faudra de plus vous munir du plugin TextFX. Pour ce faire, rendez-vous sur SourceForge [2], et téléchargez la dernière version du plugin (Fig 10). Il vous suffit ensuite d’extraire l’archive téléchargée dans votre dossier d’installation de Notepad++ (Fig 11).

TextFX Plugin download on SourceForge
Fig 10 : TextFX Plugin download on SourceForge
Plugin installation for Notepad++
Fig 11 : Plugin installation for Notepad++

Une fois Notepad++ lancé, vous pouvez avoir un fichier contenant des doublons (Fig 1).

Notepad++ file with duplicates
Fig 1 : Notepad++ file with duplicates

Pour supprimer ceux-ci, dans un premier temps, vérifiez que l’option « +Sort outputs only UNIQUE (at column) lines » (Fig 2) est sélectionnée, puis sélectionnez vos données (Fig 3).

Notepad++ sort unique
Fig 2 : Notepad++ sort unique
Notepad++ select data
Fig 3 : Notepad++ select data

Ensuite, deux possibilités s’offrent à vous :

Notepad++ sort case insensitive
Fig 4 : Notepad++ sort case insensitive
Notepad++ duplicate lines removed
Fig 5 : Notepad++ duplicate lines removed
Notepad++ sort case sensitive
Fig 6 : Notepad++ sort case sensitive
Notepad++ identical lines removed
Fig 7 : Notepad++ identical lines removed

Vous pouvez ensuite, avec les deux listes créées, et après les avoir collées dans deux fichiers différents, les comparer (Fig 8), avec, pour résultat, l’affichage dans le premier fichier des lignes n’existant pas dans le second fichier, et, dans le second, l’affichage des lignes qui n’existent pas dans le premier fichier (Fig 9).

SENotepad++ compare files
Fig 8 : SENotepad++ compare files
Notepad++ compare results
Fig 9 : Notepad++ compare results

Lecture sur le sujet

2 réflexions sur “Ordonner une liste et supprimer les doublons

  • Vos images sont en 404

    • Merci pour votre retour, le problème devrait à présent être résolu

Commentaires fermés.