Bloccare lo spam con il mio database Bayes per Spamassassin

Ho deciso di pubblicare il mio database Bayes di Spamassassin (SA), contenente ormai piu’ di 300.000 voci di spam, che puo’ tornare utile a tutti i provider e/o persone con MTA in housing appena installati, per insegnare un po’ di cose al proprio spamassassin e non ritrovarsi con centinaia di mail di spam in casella.

Il funzionamento e’ molto semplice, se avete spamassassin installato nel vostro server avrete anche il comando sa-learn con il quale potrete dare in pasto il database e insegnare cosi’ al vostro SA tutto quello che ha imparato dalle mie mail taggate come spam.

Le statistiche Bayesiane si basano sull’evidenza empirica ovvero sulla raccolta di dati, l’esempio piu’ eclatante per spiegarvi meglio come funziona il ragionamento e’ questo:

Il sole è sorto e tramontato per miliardi di anni. Il sole è tramontato anche stanotte. Con un’elevata probabilità, il sole domani sorgerà.

Piu’ o meno nello stesso modo funzionano i filitri Bayes di SA, piu’ dati (spam/non spam) si accumulano e piu’ questo impara a marcare le nuove email come spam (se effettivamente lo sono), io devo dire che ho risolto gran parte dei miei problemi con questo strumento.

Ed ecco come fare:

Scaricate il database di Bayes

eseguite il comando (da root va benissimo):

tar xjvvf spamassassin-bayes-db.tar.bz2
sa-learn --restore spamassassin-bayes-db

Attenzione pero’ che il comando restore fa prima una clear del vostro attuale db (sempre che ce l’avete), per questo consiglio di usarlo soprattutto su sistemi nuovi.

Quando avra’ finito, eseguendo questo comando: spamassassin -D --lint, noterete che lo spam “imparato” e’ salito notevolmente greppando la riga corpus size. (es. corpus size: nspam = 311808, nham = 24042)
Non vi rimane che aggiustare lo score della vostra configurazione facendo delle prove, vi consiglio di tenere per una giornata il “view all message header” del vostro client di posta settato in modo da vedere con che livello di spam vengono taggate le vostre email e partire da quel punto.



Leave a Comment