Skip to content

Eine Biene gegen Spam

Wenn ich vor dem Hören des neusten Podcast von s9y InfoCamp mit dieser Aussage konfrontiert worden wäre, hätte ich bloss verständnislos mit dem Zeigefinger an die Stirn getippt.

Matthias, Robert, Grischa und Malte unterhalten sich über die Spam und Ham (Gegenteil von Spam) im Allgemeinen und die möglichen Abwehrmassnahmen in serendipty im Speziellen. Dabei gehen sie auf Plugins ein, die diese Aufgabe übernehmen. Ich möchte hier bloss auf die zwei Plugins eingehen, die am ausführlichsten besprochen werden und die ich einsetze. Es handelt sich dabei um die SpamBiene von Grischa und den Bayes-Filter von Malte.

Spam-Biene Dabei nutzt die Spam-Biene im Grunde einen ganz simplen Trick um die Spam-Bots in die Irre zu führen. An der Stelle wo ein Leser ein Kommentar erfassen kann platziert das Plugin ein zusätzliches Feld mit Namen "phone" und versteckt diese Eingabemöglichkeit vor dem Besucher. Spamer hingegen lesen den HTML-Code maschinell aus und füllen dieses Feld ebenfalls aus. So kann davon ausgegangen werden, dass es sich nicht um einen menschlichen Schreiber handelt und der Kommentar wird verworfen.

Als zweite Massnahme bietet das Plugin ein sogenanntes Captcha. Viele werden jetzt die Nase rümpfen und sich denken, Captchas sind doch diese verpönten, barriereUNfreien Grafiken, die abgetippt werden müssen um sich als Mensch zu outen. Schon richtig. Aber im Fall der Spam-Biene wird das Captcha ebenfalls versteckt und bereits vom System ausgefüllt. Auch hier fällt eine Maschine wiederum darauf herein. Im Gegensatz zur obigen Massnahme mit dem Phone-Feld kann die Captcha-Funktion abgeschaltet werden.

Spamblock-Bayes Bei dieser Art der Spam-Bekämpfung handelt es sich um ein erstellen und vergleichen von positiv- und negativ-Wortlisten. Das Plugin muss zu Beginn des Einsatzes trainiert werden. Das heisst, dass die Wortlisten befüllt werden müssen. Dies geschieht entweder automatisch mit den bereits vorhandenen Kommentaren oder per Hand, indem Kommentare manuell als positiv oder negativ bewertet werden. Nach einer gewissen Lernphase kann der Filter dahingehend eingestellt werden, dass er selbständig die "schlechten" Kommentar herausfilter und verwirft oder sie in den Papierkorb wirft, wo sie von Blogbetreiber eingesehen werden können.

Seit zwei Wochen setzte ich nun diese beiden Plugins ein. Dabei ist die Reihenfolge wichtig. Zuerst die Biene und dann Bayes. Wenn sich das weiterhin bewähren sollte sehe ich keinen Grund das Core-Spam-Modul wieder zu aktivieren.

Für weitere Informationen und Konfigurationsmöglichkeiten empfehle ich euch dringend, den Podcast zu hören und die Seiten der beiden Entwickler zu besuchen.

Trackbacks

Keine Trackbacks

Kommentare

Ansicht der Kommentare: Linear | Verschachtelt

Grischa am :

Ui, schick zusammen gefasst. :-)

Nur eine Anmerkung noch: Das "Hidden Captcha" der Biene unterscheided sich von normalen Captchas nicht nur dadurch, dass es automatische (per JS) ausgefüllt und versteckt wird. Es besteht vor allem auch nicht aus diesen unlösbaren und nicht barrierefreien Bildern / Sounds. Es sind sehr simple Testfragen in Standard Text dargestellt, mit denen auch jeder Screenreader klar kommt.

Das ist notwenig für Besucher, die ohne Javascript rein kommen. Die müssen das HCaptcha dann nämlich ausfüllen, dürften aber mit Captchas wie "Was ist Eins plus Vier" vermutlich deutlich weniger Probleme haben als mit diesen vermalledeiten UrCaptchas. ;-)

hampa am :

Danke Grischa für diese Ergänzungen. Du hast natürlich vollkommen recht. Ausrede: Ich wollte halt nicht den ganzen Inhalt des Podcasts vor wegnehmen. Die Hörer von s9y InfoCamp sollen doch auch noch was zum Hören haben. ;o)

Kommentar schreiben

Umschließende Sterne heben ein Wort hervor (*wort*), per _wort_ kann ein Wort unterstrichen werden.
Standard-Text Smilies wie :-) und ;-) werden zu Bildern konvertiert.
Die angegebene E-Mail-Adresse wird nicht dargestellt, sondern nur für eventuelle Benachrichtigungen verwendet.
Markdown-Formatierung erlaubt
Formular-Optionen