Skip to content

Eine Biene gegen Spam

Wenn ich vor dem Hören des neusten Podcast von s9y InfoCamp mit dieser Aussage konfrontiert worden wäre, hätte ich bloss verständnislos mit dem Zeigefinger an die Stirn getippt.

Matthias, Robert, Grischa und Malte unterhalten sich über die Spam und Ham (Gegenteil von Spam) im Allgemeinen und die möglichen Abwehrmassnahmen in serendipty im Speziellen. Dabei gehen sie auf Plugins ein, die diese Aufgabe übernehmen. Ich möchte hier bloss auf die zwei Plugins eingehen, die am ausführlichsten besprochen werden und die ich einsetze. Es handelt sich dabei um die SpamBiene von Grischa und den Bayes-Filter von Malte.

Spam-Biene Dabei nutzt die Spam-Biene im Grunde einen ganz simplen Trick um die Spam-Bots in die Irre zu führen. An der Stelle wo ein Leser ein Kommentar erfassen kann platziert das Plugin ein zusätzliches Feld mit Namen "phone" und versteckt diese Eingabemöglichkeit vor dem Besucher. Spamer hingegen lesen den HTML-Code maschinell aus und füllen dieses Feld ebenfalls aus. So kann davon ausgegangen werden, dass es sich nicht um einen menschlichen Schreiber handelt und der Kommentar wird verworfen.

Als zweite Massnahme bietet das Plugin ein sogenanntes Captcha. Viele werden jetzt die Nase rümpfen und sich denken, Captchas sind doch diese verpönten, barriereUNfreien Grafiken, die abgetippt werden müssen um sich als Mensch zu outen. Schon richtig. Aber im Fall der Spam-Biene wird das Captcha ebenfalls versteckt und bereits vom System ausgefüllt. Auch hier fällt eine Maschine wiederum darauf herein. Im Gegensatz zur obigen Massnahme mit dem Phone-Feld kann die Captcha-Funktion abgeschaltet werden.

Spamblock-Bayes Bei dieser Art der Spam-Bekämpfung handelt es sich um ein erstellen und vergleichen von positiv- und negativ-Wortlisten. Das Plugin muss zu Beginn des Einsatzes trainiert werden. Das heisst, dass die Wortlisten befüllt werden müssen. Dies geschieht entweder automatisch mit den bereits vorhandenen Kommentaren oder per Hand, indem Kommentare manuell als positiv oder negativ bewertet werden. Nach einer gewissen Lernphase kann der Filter dahingehend eingestellt werden, dass er selbständig die "schlechten" Kommentar herausfilter und verwirft oder sie in den Papierkorb wirft, wo sie von Blogbetreiber eingesehen werden können.

Seit zwei Wochen setzte ich nun diese beiden Plugins ein. Dabei ist die Reihenfolge wichtig. Zuerst die Biene und dann Bayes. Wenn sich das weiterhin bewähren sollte sehe ich keinen Grund das Core-Spam-Modul wieder zu aktivieren.

Für weitere Informationen und Konfigurationsmöglichkeiten empfehle ich euch dringend, den Podcast zu hören und die Seiten der beiden Entwickler zu besuchen.