Notepad ++ как извлекать адреса электронной почты из файла
Имея файл, например извлечение из вашего почтового ящика, и вы хотите извлечь только адреса электронной почты?
С помощью Notepad++ и простое регулярное выражение, это довольно просто.
Ниже приведен полный пример или, чтобы подвести итог, откройте свой файл, используйте ниже regexp для поиска адресов электронной почты, добавьте разрывы строк до и после каждого из них, а затем отметьте строки, содержащие адрес электронной почты, и удалите немаркированные строки.
Довольно просто — но см. Ниже полный пример, используя это умное регулярное выражение из Stackoverflow.com обсуждение «Извлечь электронную почту из текста с помощью notepad ++ и regex», и с дальнейшим вдохновением из superuser.com обсуждение «Как удалить все строки в Notepad ++, кроме строк, содержащих нужное мне слово?».
(\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,4}\b)
Начиная с вашего файла — в этом примере извлечение адресов «TO» в папке электронной почты Outlook 2013 отправлено — у вас может быть много странных символов, ненужный текст, адреса электронной почты в одной строке, …
Первый шаг — открыть параметр «Заменить», «Поиск»> «Заменить» или Ctrl+H
Здесь, в Find, введите ниже регулярное выражение.
(\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,4}\b)
В поле «Заменить» введите это, чтобы заменить каждый адрес электронной почты на: break line \ n + строка поиска $ 1 + разрыв строки \ n
\n$1\n
Обязательно проверьте переключатель «Регулярное выражение» и нажмите «Заменить все».
Посмотрите результат — каждый адрес электронной почты теперь находится на одной линии в новой строке.
Следующий шаг — идентифицировать все эти строки, содержащие только один адрес электронной почты. Откройте вкладку «Марк» в окне поиска. Скопируйте те же регулярные выражения, что и раньше, чтобы идентифицировать адреса электронной почты. Убедитесь, что флажок Регулярное выражение отмечено вместе с параметром «Закладка» и запустите операцию маркировки с помощью «Отметить все»
В файле все строки, содержащие адреса электронной почты, теперь отмечены закладкой.
В Search => Bookmark выберите Удалить строки без подписки
И вуаля! Теперь ваш файл содержит только адреса электронной почты без ненужного текста.
В качестве последнего шага вы можете удалить дубликаты, чтобы иметь список уникальных адресов электронной почты.