DevToys Web Pro iconDevToys Web ProBlog
Ohodnoťte nás:
Vyzkoušejte rozšíření pro prohlížeč:

Normalizátor e-mailů

Hotovo
Vstup: 10Jedinečné: 8Duplicitní: 2

Vstupní e-maily (jeden na řádek)

  • Normalizované (bez duplicit)

  • Technické detaily

    Jak funguje normalizátor e-mailů

    Co nástroj dělá

    Email Normalizer kanonizuje e-mailové adresy tím, že převede celou adresu na malá písmena, odstraní tečky z lokální části (ve stylu Gmailu) a odstraní aliasy pomocí plus adresování (user+tag@domain se změní na user@domain). Tím odhalí, kdy několik zdánlivě různých e-mailových adres ve skutečnosti doručuje do stejné schránky, což vám pomůže odhalovat duplicitní účty a normalizovat databáze kontaktů.

    Běžné případy použití pro vývojáře

    Produktoví inženýři používají normalizaci e-mailů, aby zabránili uživatelům vytvářet více účtů pro bezplatnou zkušební verzi pomocí triků s tečkami (j.ohn@gmail.com = john@gmail.com) nebo plus aliasů (john+spam@gmail.com). Marketingové týmy před odesláním kampaní deduplikují mailing listy, aby se vyhnuly dvojímu odeslání. Antifraud systémy normalizují e-maily při registraci, aby odhalily dříve zablokované uživatele, kteří se pokoušejí znovu zaregistrovat s kosmetickými variacemi e-mailu.

    Datové formáty, typy nebo varianty

    Gmail a Google Workspace ignorují tečky v lokální části a podporují plus adresování. Outlook/Hotmail ignoruje plus adresování, ale tečky neignoruje. Yahoo používá místo plus systém aliasů založený na pomlčkách. Fastmail a ProtonMail podporují plus adresování. Nástroj ve výchozím nastavení aplikuje normalizační pravidla ve stylu Gmailu (odstranit tečky, odstranit plus aliasy, převést na malá písmena), což pokrývá většinu spotřebitelských e-mailových adres, ale může příliš normalizovat u firemních poštovních serverů, které považují tečky za významné.

    Běžné nástrahy a okrajové případy

    Ne všechny poštovní servery ignorují tečky — odstranění teček u adres mimo Gmail může namapovat dva odlišné uživatele na stejnou normalizovanou adresu a způsobit falešnou deduplikaci. Doménová část e-mailu je podle RFC 5321 necitlivá na velikost písmen, ale lokální část je technicky citlivá na velikost písmen (i když to téměř žádný server nevynucuje). Plus adresování se stále častěji používá jako legitimní nástroj ochrany soukromí, takže jeho blokování může frustrovat uživatele dbající na soukromí. Mezinárodní doménová jména (IDN) vyžadují pro správné porovnání normalizaci pomocí punycode.

    Kdy použít tento nástroj vs. kód

    Použijte tento nástroj v prohlížeči k rychlé kontrole několika adres na duplicity nebo k otestování, jak by vaše normalizační pravidla transformovala konkrétní vstupy. Pro produkční registrační toky implementujte normalizaci jako funkci na straně serveru, která aplikuje pravidla specifická pro poskytovatele (Gmail vs Outlook vs vlastní domény) a ukládá jak původní, tak normalizovanou podobu, abyste mohli zobrazovat původní adresu a zároveň deduplikovat podle normalizované verze.