ChrisB: E-Mail mittels Character Entities verschlüsseln ... sinnvoll?

Beitrag lesen

Hi,

Das Auflösen von Entity- oder numerischen Zeichenreferenzen gehört zu den Basisanforderungen an ein Programm, das HTML verarbeiten oder interpretieren will.

Ein solcher Bot will kein HTML verarbeiten oder interpretieren, sondern lediglich E-Mail-Adressen herausfiltern.

Da ich meinen Bot nicht manuell auf jeden einzelnen URL ansetzen will, werde ich ihn zumindest so schreiben, dass er automatisch weitere Links findet und in seine Liste abzuklappernder Adressen aufnimmt – ganz grundlegende Web-Spider-Funktionalität, wenn du so willst.
Und diese Funktionalität werde ich sicher nicht selber schreiben, sondern auf eine der zahlreichen Libs zurückgreifen, die das bereits eingebaut haben. Basis-Funktionalität zum Verarbeiten von HTML ist also schon von Anfang an dabei.

Natürlich könnte man einen Bot so programmieren, dass er Entities auflöst. Aber warum sollte man den Aufwand betreiben? In der Zeit, in der der ein Bot eintausend escapete E-Mail-Adressen findet, könnte er auch eine Million nicht-escapete im Web finden.

Ressourcen sind, jedenfalls bzgl. des minimalen Extra-Aufwandes, den das Auflösen der Entities/NCRs angeht, kein Problem für mich – bedenke, ich will nachher Abermillionen von Emails versenden, also darfst du davon ausgehen, dass ich entsprechende Ressourcen bereits zur Genüge vorhalte. Früher waren das hauptsächlich meine Bot-Netze, heutzutage kommen vermutlich auch noch die Clouds hinzu.

Ich *vermute*, dass der Großteil der Bots tatsächlich dumm gehalten ist und Entities nicht auflöst. Ich setzte für E-Mail-Adressen tatsächlich Escapes ein, mit dem Wissen, dass das nur gegen die dümmsten Bots hilft.

Und eben deshalb hilft es letztendlich effektiv gar nicht.

Wenn meinem dummen Bot der Saft ausgeht, und er mit nicht mehr genug frische Mailadressen liefert – dann kaufe ich gleich Listen von extern ein, brauche mich mit der Bot-Programmierung nicht mehr herumschlagen, und konzentriere mich auf mein v1agr4-ca$in0-enlaaargement-…-Kerngeschäft.

Aus Nutzer-Sicht:

Heutzutage noch einen Furz darum zu geben, ob ich vielleicht einen von hundert oder auch nur zehn Bots davon abhalten kann, meine Mailadresse aufzufinden, halte ich für vollkommen vergebliche Liebesmüh’.

Spam ist ein existentes Phänomen, dass ich nicht mehr durch „Geheimhalten“ meiner Mailadresse bekämpfen kann.
Da investiere ich lieber meine Ressourcen in vernünftige Bekämpfung des Spams selber auf Empfänger-Seite – Spam-Filter, Blacklists, etc.

MfG ChrisB

--
Autocomplete has spoiled me to a point where it happens every so often that I encounter a CAPTCHA, and I just type in the first character … and then wait for the rest of the code to be automatically suggested :/