Les messages non sollicités portent souvent sur les mêmes sujets (viagra, montres de luxe, loterie, etc) et contiennent donc souvent des mots et phrases similaires.
Un filtre bayésien permet de calculer une probabilité qu'un message soit un spam en fonction de son contenu, par rapport à une base de données de référence qui contient à la fois des exemples de messages légitimes et de spams.
Ce filtre est très efficace et ne provoque que très peu de faux positifs (messages légitimes classés à tort comme spam).
Pour plus d'informations sur l'algorithme de filtrage bayésien, lire :
http://fr.wikipedia.org/wiki/Filtrage_bay%C3%A9sien_du_spam