Notepad ++ extrahuje e-mailové adresy z textového souboru

Notepad ++ extrahuje e-mailové adresy z textového souboru

Jak extrahovat e-mailové adresy z textového souboru

Máte soubor, například extrakci z vaší poštovní schránky, a chcete extrahovat pouze e-mailové adresy?

Použití Notepad ++ a jednoduchého regulárního výrazu je to celkem jednoduché.

Níže uvádíme úplný příklad nebo shrnutí otevřete soubor, použijte pod adresářem regexp e-mailové adresy, přidejte řádkové přestávky před a po každém z nich a označte řádky obsahující e-mailovou adresu a odstraňte neoznačené řádky.

Poznámkový blok ++ regex extrakt text

Docela přímočarý - ale uvidíte pod plným příkladem pomocí tohoto chytrého regexp ze Stackoverflow.com diskuse na téma "Extrahujte emaily z textu pomocí poznámkového bloku ++ a regexp" a s další inspirací z diskuze superuser.com "Jak odstranit všechny řádky v poznámkovém bloku ++ s výjimkou řádky obsahující slovo potřebuji? ".

(\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,4}\b)

Začínáme s vaším souborem - v tomto příkladu lze extrahovat adresy "TO" adresáře e-mailů aplikace Outlook 2013 - můžete mít spoustu podivných znaků, zbytečný text, e-mailové adresy na stejném řádku ...

Prvním krokem je otevřít možnost Nahradit, Hledat => Nahradit nebo Ctrl + H.

Nnotepad ++ regulární výraz

Zde v části Najít, zadejte pod regulární výraz.

(\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,4}\b)

V položce Nahradit zaškrtněte toto, chcete-li nahradit každou e-mailovou adresu: zlomek řádku \ n + vyhledávací řetězec $ 1 + řádek \ n

\n$1\n

Zaškrtněte políčko Pravidelné výrazy a klepněte na Nahradit vše.

Zobrazte výsledek - každá e-mailová adresa je nyní sama na novém řádku.

Dalším krokem je identifikovat všechny tyto řádky obsahující pouze jednu e-mailovou adresu. Otevřete okno Marktab v okně Hledat. Zkopírujte stejný regexp jako předtím, abyste identifikovali e-mailové adresy. Ujistěte se, že je zaškrtnuto políčko Pravidelný výraz spolu s možností čáry Záložka a spusťte operaci označování pomocí funkce Označit vše

V souboru jsou všechny řádky obsahující e-mailové adresy nyní označeny záložkou.

Ve Vyhledávací síti => Záložka vyberte řádek Odstranit neoznačené řádky

A voilà! Váš soubor nyní obsahuje pouze e-mailové adresy bez zbytečného textu.

Jako poslední krok můžete odstranit duplikáty, abyste měli seznam jedinečných e-mailových adres.

Extrahujte e-maily z textu file

Chcete-li z textového souboru extrahovat e-maily, otevřete jej pomocí textového editoru Poznámkový blok ++ a použijte výše uvedené pokyny, použijte regulární výraz, označte všechny e-maily, vyberte pouze e-maily a zkopírujte je.

Poznámkový blok ++ zkopíruje všechny regexní zápasy

Chcete-li zkopírovat všechny regexní zápasy, použijte vyhledávací okno Marktab in Notepad ++. Tím, že vložíte regexp, budou všechny výsledky, které odpovídají regexpu, označeny a mohou být tímto způsobem vybrány a zkopírovány.

Odstraňte duplicity v poznámkovém bloku ++

Poznámkový blok ++ pásy HTML značky

Chcete-li odstranit značky HTML v poznámkovém bloku ++ z textu, použijte pod regulárním výrazem<.*?>|</.*?>, a nahradit například mezerou. Zkontrolujte, zda je zaškrtnuto políčko regulárního výrazu ve vyhledávacím formuláři.

<.*?>|

Poznámkové bloky ++ extrahujte adresy URL

V nabídce nahrazení, přístupné pomocí zástupce CTRL + H, použijte následující regexp s regulárním výrazem a dotykem se porovnává nový řádek:

.*?(http\:\/\/www\.[a-zA-Z0-9\.\/\-]+)

A použijte tento nahrazující řetězec, abyste získali seznam všech adres URL extrahovaných v souboru:

$1\n

Jak zkopírovat označené řádky do poznámkového bloku ++

Značený text v poznámkovém bloku ++ lze kopírovat pomocí vyhledávání pomocí regexu pomocí nabídky Hledat> značka, výběrem řádku záložek a kliknutím na značku všech.

Poté použijte volbu Hledat> Záložka> Zkopírujte záložku s označenými řádky a výsledek lze vložit do nového souboru obsahujícího kopii označených čar.

Jak extrahovat e-maily z textu několika kliknutími

Chcete-li extrahovat e-maily z textu, stačí zadat regulární výraz, abyste zjistili všechny e-mailové adresy v textovém souboru, například extrakci všech kontaktů z aplikace Microsoft Outlook.

Poté identifikujte e-mailové adresy a odstraňte další řádky. Použití NotePad + +, to lze snadno provést podle našeho průvodce.

extrahovat e-mailovou adresu z Notepad + + pomocí regexu

Jak extrahovat e-maily ze souboru CSV ?

E-mailové adresy v CSV, jako je export MicrosoftOutlook, fungují úplně stejně jako u standardního textového souboru.

To extrahovat e-maily ze souboru CSV , start by opening the CSV file with Textový editor Notepad ++, distinguish the single email addresses with the process explained above, and copy them.

To extrahovat e-maily ze souboru CSV follow the following process:

  • Otevřete soubor CSV pomocí textového editoru Notepad ++,

  • Zadejte regulární výraz odpovídající potenciálním e-mailovým adresám,

  • Nahraďte je e-mailem a zalomením řádku,

  • Použijte regulární výraz k uložení záložních e-mailových adres,

  • Odstraňte řádky bez označení, které neobsahují e-mailové adresy,

  • Chcete-li získat konečný seznam, proveďte operaci odstranění duplikátů, která vyčistí váš soubor a e-maily budou extrahovány ze souboru CSV a připraveny k exportu.

Po dokončení procesu extrakce e-mailů ze souboru CSV pomocí regulárního výrazu je budete moci zkopírovat přímo z výsledků.

Přečtěte si více

Podobné články

Komentáře (7)

Irene Page, 2018-08-19
Simple, clair et bien expliqué, merci beaucoup
Lee Ryan, 2018-08-19
No sabía acerca de estos detalles, por favor haga más
Raymond Mcbride, 2018-08-19
O poveste grozavă, mulțumesc pentru schimbul
Kathryn Baker, 2018-08-19
ที่ทำงานได้ดีสำหรับฉันไม่จำเป็นต้องดูเพิ่มเติมใด ๆ
testkingaws, 2018-11-05
Thank you, author, was very useful for me
George Mauricio Santana Lima, 2019-01-16
THIS TUTORIAL IS AMAZING, SUCH AN USEFUL GUIDE! <3
Kaspars, 2019-01-16
Thank you! This came handy!

Zanechat komentář