Benjamin Wilger: Massendownloads via HTTrack & Co verhindern

Hallo,

unsere Seite ist ziemlich stark frequentiert und wir kommen regelmäßig an unser Traffic-Limit. Wenn nun jemand mit Programmen wie HTTrack oder Offline Explorer versucht, unsere Seite komplett zu saugen, sind schnell mal 500 MB Traffic aufgekommen.

Gibt es eine Möglichkeit, per htaccess oder so, solche Programme auszuhebeln?

Grüße,
Benjamin Wilger
---------------
www.ActiveVB.de

  1. Hallo,

    unsere Seite ist ziemlich stark frequentiert und wir kommen regelmäßig an unser Traffic-Limit. Wenn nun jemand mit Programmen wie HTTrack oder Offline Explorer versucht, unsere Seite komplett zu saugen, sind schnell mal 500 MB Traffic aufgekommen.

    Gibt es eine Möglichkeit, per htaccess oder so, solche Programme auszuhebeln?

    Grüße,
    Benjamin Wilger

    www.ActiveVB.de

    Damit wirst Du wahrscheinlich nicht sehr weit kommen. Du könntest höchtens bestimmte User Agents sperren. Aber die lassen sich normalerweise problemlos bei jeder derartigen Software einstellen. Aber damit hättest Du zumindest ein paar draußen, die das nicht wissen.

  2. Wenn nun jemand mit Programmen wie HTTrack oder Offline Explorer versucht, unsere Seite komplett zu saugen, sind schnell mal 500 MB Traffic aufgekommen.

    Gibt es eine Möglichkeit, per htaccess oder so, solche Programme auszuhebeln?

    Ihr könnt diese Programme per mod_access/mod_env ganz aussperren. Ich blockiere beispielsweise einen Spider, der sich an keinerlei Regeln hält und wöchentlich meine Seiten komplett rauf und runter abrufen will (inklusive Grafiken, CSS- und Javascript-Dateien), folgendermaßen:

    SetEnvIf User-Agent compatible;?AvantGo blockspider
      Order Deny,Allow
      Deny from env=blockspider

    Das geht natürlich nur, solange Euch die Namen der Programme bekannt sind und die Identifikation auf Benutzerseite nicht ausgeblendet wird (Stichwort Webwasher). Obendrein ist diese Methode vielleicht etwas sehr rigide, weil sie Leute, die nur einen kleinen Teil zum Offline-Lesen runterladen wollen, ebenfalls betrifft.

    Probiert stattdessen (oder zusätzlich) besser mod_throttle ( http://www.snert.com/Software/mod_throttle/). Soweit ich das überblicke, sollte dort mittels ThrottleClientIP eine volumenabhängige Auszeit pro IP möglich sein.

    Gruß,
      soenk.e