Fandom

Spamwiki

SpamAssassin

694oldal a wikin
Add New Page
Vita2 Share
Spamassassin.png

A program megjelölt egy levelet.

A SpamAssassin egy többszörös díjnyertes, nyílt forráskódú, Perl nyelven írt spamszűrő, mely a kapott e-mail elemezésével, kulcsszavak, írásstílusok, és sok egyéb jel figyelésével, feketelistákkal, valamint a Bayesian-szűrés módszerét is használva próbálja megállapítani egy levélről, hogy az spam-e, vagy sem.

Az angol assassin szó orgyilkost jelent.

A program története Szerkesztés

Mark Jeftovic 1997 augusztusában kezdett fejleszteni egy filter.plx nevű szűrőt, mely kódját átdolgozva Justin Mason létrehozta a SpamAssassint, melyet aztán a SourceForge.net oldalon 2001. április 20-án jelentetett meg.

Ma az Apache projekt része, 2004. szeptember 24-én jelent meg az első verziója (3.0.0) itt.

Működési elv Szerkesztés

A program hozzávetőlegesen ezer különböző tesztnek vet alá minden e-mailt. Ezek a tesztek az e-mailek tartalmát, felépítését, szabványosságát, méretét, képek, csatolmányok elhelyezkedését, a levél korábbi állomásait vizsgálják át, meghamisításra utaló jeleket keresnek. és még sok mást is vizsgálnak. Ezen tesztek mindegyike egy bizonyos pontszámot ér. A program összeadja azokat a pontszámokat, amelyek a levélre illeszkedő tesztekhez tartoznak. A programot használók (általában rendszergazdák) maguk döntik el, hogy hány ponttól tekintenek egy levelet spamgyanúsnak, azután spamnek, és hogy mit tegyenek ezekkel a levelekkel. Nagyon magas pontszám esetén a levelet egyszerűen törölni is lehet.

A tesztek legtöbbje pozitív pontszámot ér, de van közöttük negatív pontot érő teszt, néhány gyakoribb példa ezek közül:

  • MISSING_SUBJECT: 2,5 pont: nincs az üzenetnek tárgya
  • NUMERIC_HTTP_ADDR: 0,9 pont: numerikus IP-cím egy URL-ben
  • BAYES_00: -2,6 pont: A Bayesian-szűrés szerint egyértelműen ham a levél
  • BAYES_99: 3,5 pont: A Bayesian-szűrés szerint egyértelműen spam a levél
  • URIBL_BLACK: 2,0 pont: Egy URL URIBL feketelistán szerepel
  • RCVD_IN_BL_SPAMCOP_NET: 2,2 pont: a levél olyan állomáson haladt keresztül, ami megtalálható a SpamCop feketelistán.

A tesztek legtöbbje nagyon technikai, néhány érdekesebb típust mégis kiemelünk:

Szabványtalanság Szerkesztés

A spammerek általában speciális célszoftvereket használnak a leveleik kiküldésére zombi számítógépeiken, így gyakran megesik, hogy ezek a szoftverek nem tudnak teljesen szabványos leveleket generálni. Némelyik kifejezetten rosszul megírt program, míg mások fejlesztésére nem fordítottak annyi energiát, amennyi a viszonylag bonyolult MIME levelek szabványos kezeléséhez szükséges volna.

A Spamassassin-szűrő keresi a szabványtalanságokat a levelekben. Ha talál ilyet, emeli az összpontszámot.

Emiatt fordul elő, hogy egyes rossz minőségű, esetleg saját fejlesztésű, amúgy legitim, de nem kellő gonddal megírt programok levelei fennakadnak a spamszűrőkön.

Levélfejlécek meghamisítása Szerkesztés

A zombi számítógépeken futó speciális spamküldő szoftverek próbálnak olyan e-maileket küldeni, hogy azok legitim felhasználók legitim leveleinek látszanak. Gyakran illesztenek például hamis Received sorokat a levelek fejlécébe, hogy úgy tűnjön, mintha a levél máshonnan érkezett volna.

A Spamassassin-szűrő ezeket a próbálkozásokat is kiszűri, és pontokkal honorálja.

Bayesian-szűrés Szerkesztés

A Spamassassin-szűrő a 2.50-es verziótól kezdve minden levelet összevet a saját Bayesian adatbázisával. Ennek eredménye képpen csökkenti, vagy növeli az összpontszámot. Ha a levél szavai egyáltalán nem mutatnak hasonlóságot az adatbázisban szereplő spamekkel, akkor a BAYES_00 teszt –2,6 pontot ad az összpontszámhoz. Ha tökéletes a hasonlóság a már megismert spamekkel, akkor a BAYES_99 tesz jelent 3,5 pontot. Vannak persze köztes értékek. Ha a program még nem tanult meg elég spam és ham üzenetet, akkor a BAYES_50 teszt lesz sikeres, ez 0 pontot ér.

Fontos, hogy a Bayesian-szűrés csak akkor ad eredményt, ha a szűrő már rendelkezik legalább 200 ham és ugyanennyi spam üzenettel.

Fejleszti is tudását: ha egy levél pontszáma nagyon alacsony, a levelet mint hamet tanítja meg a Bayesian szűrővel. Ha egy levél pontértéke nagyon magas a levelet spamként rögzíti a Bayesian adatbázisban. Ez a fajta tanítás automatikus, beavatkozást nem igényel.

Ha a felhasználók Hamis pozitív eredményt, vagy Hamis negatív eredményt jeleznek, beavatkozásra van szükség: az adott ham vagy spam e-mail manuálisan is megtanítható a Bayesian-szűrőnek.

A Bayesian-mérgezés megjelenése óta a Spamassassin erre utaló jeleket is keres és pontoz.

Feketelisták Szerkesztés

A Spamassassin-szűrő a levél fejléceiben (lásd még: E-mail fejlécek megjelenítése) megtalálható állomásneveket, IP-címeket, a levél tárgyában, illetve szövegében szereplő hivatkozásokat (URL-eket) több fekete- és fehérlistában is ellenőriz. A fenti példák közül az URIBL_BLACK teszt sikere azt jelenti, hogy a levélben található egy vagy több olyan hivatkozás, mely az URIBL feketelistán megtalálható. Ilyenkor növekszik a pontérték, jelen esetben 2 ponttal.

SPF Szerkesztés

A Spamassassin-szűrő a Sender Policy Framework ellenőrzést is végez. Automatikusan vizsgálja meg a küldő domain SPF rekordját, ha nincs rendben valami, akkor például a SPF_FAIL teszt 1,9 ponttal emeli az összpontszámot.

több ellenőrző algoritmus során többek között megvizsgálja egy üzenet fejlécét (tárgysorát) és a szöveget is, majd a spamgyanússág szerint pontozza. Az eljárást heurisztikus, értő szűrési eljárásnak hívják. Ha egy levelet spamnek vél, a megadott módon jár el vele: törli, karanténba küldi vagy csak jelzi ezt. Például a „LIMITED_TIME_ONLY” tárgysor 0,3 pontot ér (egy levél a 2.55-ös verzió szerint öt ponttól spam).

A szűrés eredménye Szerkesztés

A sok teszt általában néhány másodperc alatt lefut, a végén egy pontszámot kapunk általában –5 és 40 között.

  • Ha a kapott pontérték 5 alatti: a levél ham (nem spam).
  • Ha a kapott pontérték 5 fölötti, de 12 alatti: a levél spamgyanús, megjelölendő
  • Ha a kapott pontérték 12 fölötti: a levél biztosan spam, törölhető

Az 5 és a 12 pontos határértékek tapasztalati értékek, a rendszergazdák ezeket szabadon megváltoztathatják. Az 5 pont általában elfogadott, de van, ahol egyáltalán nem használnak felső határt, ekkor minden levél kézbesítésre kerül. Máshol még alacsonyabb felső határt alkalmaznak, 8 pontot legitim levéllel elérni már szinte lehetetlen: a bátrabbak akár 8 pont fölött is törölhetnek.

Megjelölés Szerkesztés

A program képes megjelölni a spamgyanúsnak talált leveleket. Beállításainak megfelelően egy szöveget szúrhat a levél tárgyába, vagy akár mellékletként is csatolhatja az eredeti levelet egy spam-reporthoz. A program általában elhelyezi a vizsgálata eredményét a levél fejlécei között, így a felhasználók levelezőprogramjukban szűrőket beállítva el tudják különíteni e spamgyanús leveleket a legitim levelezésüktől.

Törlés Szerkesztés

Nyugodtan, automatikusan törölhetők, illetve karanténba rakhatók azok a levelek, melyekre a Spamassassin 12–15 pontnál magasabb pontszámot adott. Ezek már teljes bizonyossággal spamek, egy megfelelően beállított rendszerben legitim levelek ennyi pontot soha nem kaphatnak.

Finomhagolás Szerkesztés

Essze.png
A témáról szerkesztőink esszét írtak:

Mint általában minden szoftver esetében, itt is sok múlik a szoftver beállításain. Érdemes a helyi igényekhez igazítani a program beállításait, így még biztosabb eredményt érhetünk el, jelentősen csökkenthetjük a hamis pozitív és a hamis negatív eredmények számát.

Kiegészítések Szerkesztés

A program különböző modulokkal szabadon kiegészíthető, vannak olyan weboldalak is, melyek saját tesztekkel egészítik ki a programot:

  • PDFassassin a PDF spamek megjelenése óta
  • SARE, azaz SpamAssassin Rules Emporium
  • FuzzyOCR

Felhasználási feltételek Szerkesztés

A SpamAssassin az Apache License, Version 2.0 alatt érhető el, amely tulajdonképpen szabad felhasználást tesz lehetővé[1].

Források Szerkesztés

  1. Apache License, Version 2.0

Kapcsolódó hírek Szerkesztés

Kapcsolódó szócikkek Szerkesztés

Bronzcsillag.png
Ez a szócikk egyike a Spamwiki legjobbjainak, így megkapta a kiemelt cikkeknek járó bronzcsillagot.

Külső hivatkozások Szerkesztés

Ad blocker interference detected!


Wikia is a free-to-use site that makes money from advertising. We have a modified experience for viewers using ad blockers

Wikia is not accessible if you’ve made further modifications. Remove the custom ad blocker rule(s) and the page will load as expected.

A Wikia-hálózat

Véletlen wiki