Notepad ++ cómo extraer direcciones de correo electrónico de un archivo
¿Tiene un archivo, por ejemplo, una extracción de su buzón, y desea extraer solo las direcciones de correo electrónico?
Utilizando Notepad++ y expresión regular simple, eso es bastante simple.
Vea a continuación un ejemplo completo o, para resumir, abra su archivo, use la expresión regular debajo para buscar direcciones de correo electrónico, agregue saltos de línea antes y después de cada una de ellas, y luego marque las líneas que contienen una dirección de correo electrónico y elimine las líneas no marcadas.
Bastante sencillo, pero vea a continuación un ejemplo completo usando esta expresión regular inteligente de una discusión de Stackoverflow.com sobre «Extraer el correo electrónico del texto usando notepad ++ y regexp», y con mayor inspiración de una discusión de superuser.com «¿Cómo borrar todas las líneas en Notepad ++ excepto las líneas que contienen una palabra que necesito?».
(\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,4}\b)
Comenzando con su archivo, en ese ejemplo, una extracción de las direcciones «TO» de una carpeta de correos electrónicos enviados por Outlook 2013, es posible que tenga muchos caracteres extraños, texto innecesario, direcciones de correo electrónico en la misma línea, …
El primer paso es abrir la opción Reemplazar, Buscar => Reemplazar o Ctrl+H
Aquí, en Buscar qué, ingrese debajo de la expresión regular.
(\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,4}\b)
En Reemplazar con, ingrese esto para reemplazar cada dirección de correo electrónico por: salto de línea \ n + cadena de búsqueda $ 1 + salto de línea \ n
\n$1\n
Asegúrese de marcar el botón de opción Expresión regular y haga clic en Reemplazar todo
Vea el resultado: cada dirección de correo electrónico ahora está sola en una nueva línea.
El siguiente paso es identificar todas estas líneas que contienen solo una dirección de correo electrónico. Abra la pestaña Marcar en la ventana Buscar. Copie la misma expresión regular que antes para identificar las direcciones de correo electrónico. Asegúrate de que la expresión regular esté marcada, junto con la opción Marcar línea, y comienza la operación de marcado con Marcar todo
En el archivo, todas las líneas que contienen direcciones de correo electrónico ahora están marcadas.
En Buscar => Marcador, seleccione Eliminar líneas no marcadas
Y voilá ! Su archivo ahora solo contiene las direcciones de correo electrónico sin texto innecesario.
Como último paso, es posible que desee eliminar los duplicados para tener una lista de direcciones de correo electrónico únicas.