Fandom

Spamwiki

A Plan for Spam

694oldal a wikin
Add New Page
Vita0 Share
Paulgraham.jpg

Paul Graham, a cikk írója

Az A Plan for Spam (Hanganyag kiejtés?, magyarul: Egy terv a spamekre) egy 2002 augusztusában megjelent publikáció, melyet a SpamBayes nevű spamszűrő készítője, Paul Graham írt. Egy új módszert, az azóta bevált és több szűrőprogramban is fölhasznált Bayesian-szűrést mutatja be benne.

A cikk alapja Szerkesztés

 

#ff0000

Az írásában a spamszakértő rámutatott, hogy a kéretlen reklámlevelek ellen éppen azok szövegével lehet fellépni: ha azokat szűrve próbálják a spamellenes szoftverek megállapítani, hogy egy e-mail spam-e.

Graham szerint a Bayesian-szűrés 1000 üzenetből csak ötször hibázik, de egyszer sem ad hamis pozitív eredményt. Megfigyelte, hogy a „click” („kattints”) szó a saját maga összeállított spamkorpusza szerint a kéretlen reklámlevelek 79,7%-ában szerepel, azonban 1,2%-ban hamis pozitív eredményt ad (tehát valójában nem spam, azaz ham üzenetekben is előfordul). Ezen egy szó jelenléte tehát nem bizonyítja, hogy az adott üzenet reklámlevél, de több gyanús szó együttes jelenléte már igen.

Szavak mellett különböző egyéb karaktersorozatok, például az „ff0000” is gyanús: a HTML-programozásban ez a vörös egyik árnyalatának színkódja – a pornográf spamek kedvelt háttérszínéé.

Ezekkel a módszerekkel végül 99,97%-os pontosságot sikerült elérnie.

Példaeset Szerkesztés

A publikáció tartalmaz egy példaüzenetet is, mely állítólag éppen akkor érkezett, amikor Graham a munkán dolgozott. A reklámlevél szövegében az alábbi gyanús szavak szerepeltek a vázolt program szerint:

qvp0045 indira mx-05 intimail $7500 freeyankeedom cdo bluefoxmedia jpg
unsecured platinum 3d0 qves 7c5 7c266675

A Bayesian-szűrés szabályai szerint lepontozott e-mailt egyértelműen spamnek tekinti egy ilyen módszert használó szűrő, kivált, mivel három olyan szót is tartalmaz, amelyek egyesével is 0,99 pontot érnek, tehát biztosan spamet jelentenek (ilyen például a „madam” szó, mely személyes levelekben legföljebb nagy kezdőbetűvel szerepel, ilyen módon gyakorlatilag sosem).

Idézet Szerkesztés

   
A Plan for Spam
I think it's possible to stop spam, and that content-based filters are the way to do it. The Achilles heel of the spammers is their message. They can circumvent any other barrier you set up. They have so far, at least. But they have to deliver their message, whatever it is. If we can write software that recognizes their messages, there is no way they can get around that.
   
A Plan for Spam

A Plan for Spam

A szócikk idegen nyelvű részei lefordítandók!

Kapcsolódó szócikkek Szerkesztés

Idezet.png
Ha további idézetekre vagy kíváncsi e témában, kattints ide:

Külső hivatkozások Szerkesztés

Ad blocker interference detected!


Wikia is a free-to-use site that makes money from advertising. We have a modified experience for viewers using ad blockers

Wikia is not accessible if you’ve made further modifications. Remove the custom ad blocker rule(s) and the page will load as expected.

A Wikia-hálózat

Véletlen wiki