Bojujeme s nevyžádanou poštou

Podle aktuálních statistik tvoří asi 90 % e-mailů, které protečou servery, nevyžádanou poštu nebo-li spam. Článek popisuje co je to spam a metody jak s ním bojovat.

Nevyžádaná pošta nebo-li spam

Podle Wikipedie: „Spam je nevyžádané masově šířené sdělení (nejčastěji reklamní) šířené internetem. Původně se používalo především pro nevyžádané reklamní e-maily, postupem času tento fenomén postihl i ostatní druhy internetové komunikace – např. diskuzní fóra, komentáře nebo instant messaging.“

Škody, které způsoby spamy nejsou zanedbatelné:

  • Vytížení linek internetu jak serverů, tak i uživatelů. Často tak velké, že uživateli zdánlivě nefunguje internet.
  • Vytížení procesorového času serverů a tím pádem i elektrické energie.
  • Ztráta času (a nervů) uživatelů při filtrování doručené pošty.
  • Zavirování počítačů uživatelů, pomalé stroje, náklady na odvirování a vyčištění PC.

Z toho plyne, že spam je zásadní problém e-mailové komunikace.

Kdo ještě pořád neví co je to spam, měl by se podívat do e-mailu, zda tam nemá anglický mail s nabídkou viagry, valia či zvětšení penisu. Spam ovšem nemusí být jen anglický. Může anglický, strojově přeložený do češtiny, ale i český e-mail, který může být seriozní nabídka. Protože je odeslaná hromadně a bez výžádání klienta, lze ji považovat za nevyžádanou poštu.

Nevyžádaná pošta se označuje jako spam, vyžádaná pošta (dobré maily) se označují často jako ham. Vychází to z původu slova spam. SPAM byl název pro masové konzervy amerických vojáků. A konzerv bylo hodně a asi nebyly zrovna nejlepší, byly „nevyžádané“ :-). SPAM je  složenina slov Spice (koření) and ham (šunka/maso). Proto ham je označení pro dobrý mail.

Místa boje s nevyžádanou poštou

S nevyžadanou poštou lze bojovat na dvou různých místech – na serveru nebo na klientovi. Každé z míst má své výhody i nevýhody.

Filtr na serveru

Ideální místo pro boj je zdánlivě poštovní server. Včas odchytí většinu spamů, takže ušetří internetové linky provozu a uživatele trápení se spamy, ale má i jednu zásadní nevýhodu. Vzhledem k množství (90 %) objemu mailů, které smaže jako spam existuje slušná pravděpodobnost, že filtr smaže i „dobrý“ mail. A to je docela problém. Občas se něco ztratí a nedoručí.

Filtr na klientovi

Poštovní server pustí vše, linky jsou vytížené a do poštovního klienta přijde poměrně vysoké množství mailů. Je nutné mít nějaký nástroj na filtrování nevyžádané pošty. Filtr může být buď součástí poštovního klienta nebo externí „průchozí POP3 filtr“. Výhodou tohoto filtru je, že vždy máme možnost vidět smazné maily a vždy nám vše dojde. Nevýhodou ovšem to, že nám chodí od až o 90 % více mailů. S dobrý filtrem a rychlým internetem to ovšem není žádný problém.

Typy filtrů

Slovní filtr

Slovní filtr je soubor jednoduchých pravidel. Může fungovat jednoduše nebo sofistikovaněji pomocí vah. Např. je-li ve  textu mailu slovo „sex“ přidá 10 procentních bodů, „viagra“ přidá nap. 50 bodů atp. Nakonci se spočítá skóre a podle nastavení přísnosti filtru se rozhodne, zda se jedná o mail dobrý nebo spam.

Nevýhodou tohoto filtru je relativně nízká spolehlivost. Např. email s textem „Ahoj miláčku. Kupila jsem ti tu viagru, večer ji vyzkoušíme“, se může poměrně snadno stát nevyžádanou poštou, kterou odchytí filtr na serveru a manželovi pravděpodobně nedojde. Následky pro manželství mohou být nepříjemné :-).

Doporučené programy: Spamihilator

Bayesovský filtr

Mnohem spolehlivější a sofistikovanější je bayesovský filtr. Využívá principů bayesovské statistiky.

Zjednodušeně funguje takto:

  • Vytvoří se databáze všech slov, které byly ve vašich mailech.
  • U každého slova se eviduje pravděpodobnost s jakou se v dobrém mailu a s jakou je ve spamu.
  • Na zakladě těchto informací se provede analýza a výpočet pravěpodobnosti, že mail je spam.
  • Vždy po výpočtu pravděpodobnosti se aktualizuje databáze.

Filtr je tedy velice adaptabilní a velmi dobře a rychle se učí. Jeho úspěšnost je téměř 99 %.  Je úplně jedno jakým jazykem komunikujete a jaká slova používáte.

Doporučené programy: Spambayes

V Linuxu se často používají filtry jako SpamAssassin nebo Bogofilter, které volat z poštovní klientů.

Spam je nevyžádané masově šířené sdělení (nejčastěji reklamní) šířené internetem. Původně se používalo především pro nevyžádané reklamní e-maily, postupem času tento fenomén postihl i ostatní druhy internetové komunikace – např. diskuzní fóra, komentáře nebo instant messaging.