FANDOM


Az inverz chi-négyzet egy algoritmus, amelyet a spamek kiszűrésére használ a clapf nevű spamszűrő. Előnye, hogy a Bayesian-szűréssel szemben a legitim, azaz ham levelekre épül, így kevesebb hamis pozitív eredményt ad.

A statisztikai eljárás a chi- vagy khi-négyzet (\chi^2) nevű matematikai szabály megfordításán alapul.

Használata a szűrésben Szerkesztés

A módszer matematikai képlete a következő:

P = (1-p_1) * (1-p_2) * ... * (1-p_n)

Q = p_1 * p_2 * ... * p_n

Ahol a p1, p2,... pn az n darab legérdekesebb token spamvalószínűsége.

Az algoritmus a következő képlet alapján használható:

H = C^-1(-2*ln(p), 2*n)

S = C^-1(-2*ln(q), 2*n)

Ahol S a spam, H a ham, ln a természetes alapú logaritmus jele.

Végül kiszámolható a kombinált indikátor (I), mely egy 0 és 1 közötti szám lesz:

I = \frac{1+H-S}{2}

A spamlevél magas S értékkel bír, míg a H értéke alacsony lesz. Ha egy levél S és H értéke nagyjából azonos, akkor arról a szűrő nem tudja megállapítani, hogy legitim levél-e, ezért „bizonytalan” jelzőt tesz rá.

Forrás Szerkesztés

Kapcsolódó szócikkek Szerkesztés

Külső hivatkozások Szerkesztés

Ad blocker interference detected!


Wikia is a free-to-use site that makes money from advertising. We have a modified experience for viewers using ad blockers

Wikia is not accessible if you’ve made further modifications. Remove the custom ad blocker rule(s) and the page will load as expected.

A Wikia-hálózat

Véletlen wiki