DevToys Web Pro iconDevToys Web ProBlog
Ohodnoťte nás:
Vyskúšajte rozšírenie prehliadača:

Normalizátor e-mailov

Hotovo
Vstup: 10Jedinečné: 8Duplikáty: 2

Vstupné e-maily (jeden na riadok)

  • Normalizované (bez duplicít)

  • Technické podrobnosti

    Ako funguje normalizátor e-mailov

    Čo nástroj robí

    Email Normalizer kanonizuje e-mailové adresy tým, že celú adresu prevedie na malé písmená, odstráni bodky z lokálnej časti (štýl Gmail) a odstráni aliasy plus-adresovania (user+tag@domain sa zmení na user@domain). Tým odhalí, keď viacero zdanlivo odlišných e-mailových adries v skutočnosti doručuje do tej istej schránky, čo vám pomôže odhaliť duplicitné účty a normalizovať databázy kontaktov.

    Bežné prípady použitia pre vývojárov

    Produktoví inžinieri používajú normalizáciu e-mailov na to, aby zabránili používateľom vytvárať viacero účtov na bezplatnú skúšobnú verziu pomocou trikov s bodkami (j.ohn@gmail.com = john@gmail.com) alebo plus aliasov (john+spam@gmail.com). Marketingové tímy pred odoslaním kampaní deduplikujú mailing listy, aby sa vyhli dvojitému odoslaniu. Antifraudové systémy normalizujú e-maily pri registrácii, aby odhalili predtým zablokovaných používateľov, ktorí sa pokúšajú zaregistrovať znova s kozmetickými variáciami e-mailu.

    Dátové formáty, typy alebo varianty

    Gmail a Google Workspace ignorujú bodky v lokálnej časti a podporujú plus-adresovanie. Outlook/Hotmail ignoruje plus-adresovanie, ale neignoruje bodky. Yahoo používa systém aliasov založený na pomlčkách namiesto plusu. Fastmail a ProtonMail podporujú plus-adresovanie. Nástroj predvolene aplikuje normalizačné pravidlá v štýle Gmailu (odstrániť bodky, odstrániť plus aliasy, previesť na malé písmená), čo pokrýva väčšinu spotrebiteľských e-mailových adries, no môže príliš normalizovať pri firemných poštových serveroch, ktoré považujú bodky za významné.

    Bežné úskalia a okrajové prípady

    Nie všetky poštové servery ignorujú bodky — odstránenie bodiek z adries mimo Gmailu môže namapovať dvoch odlišných používateľov na tú istú normalizovanú adresu, čo spôsobí falošnú deduplikáciu. Doménová časť e-mailu je podľa RFC 5321 necitlivá na veľkosť písmen, ale lokálna časť je technicky citlivá na veľkosť písmen (hoci to takmer žiadny server nevynucuje). Plus-adresovanie sa čoraz viac používa ako legitímny nástroj ochrany súkromia, takže jeho blokovanie môže frustrovať používateľov dbajúcich na súkromie. Medzinárodné názvy domén (IDN) vyžadujú punycode normalizáciu na správne porovnanie.

    Kedy použiť tento nástroj vs. kód

    Použite tento nástroj v prehliadači na rýchlu kontrolu niekoľkých adries na duplicity alebo na otestovanie, ako by vaše normalizačné pravidlá transformovali konkrétne vstupy. Pre produkčné registračné toky implementujte normalizáciu ako serverovú funkciu, ktorá aplikuje pravidlá špecifické pre poskytovateľa (Gmail vs Outlook vs vlastné domény) a ukladá pôvodnú aj normalizovanú podobu, aby ste mohli zobrazovať pôvodnú, zatiaľ čo deduplikujete podľa normalizovanej verzie.