SORGLOS INTERNET - Ideal für Gastgewerbe und alle anderen free WLAN-Anbieter
Computing-Themen

Computing-Info: Wayback Machine vom Crawling aussperren

Ein Blog rund ums Computing - irgendwas geht immer nicht: die Hard- oder Software, im Internet oder im Webspace...

Jeder aktive Internetnutzer hinterlässt in Foren und Newsgroups Spuren, die ihn - sofern er sich mit dem 'richtigen' Namen anmeldete - bis über sein Lebensende hinaus verfolgen können. In Foren mag man über den Betreiber eine Löschung erwirken können. Doch alte Usenet-Einträge zu beseitigen ist unmöglich, nachdem Google vor Jahren begann, diese Bestände in seine Server kontinuierlich einzulesen. Dieses Werk ist noch nicht vollbracht - es sind zu umfangreiche Daten für eine schnelle Speicherung und Indizierung. Wogegen Sie sich jedoch erfolgreich wehren können ist, dass ältere und möglicherweise heute peinliche erste Gehversuche mit eigenen Internetseiten bis zum St. Nimmerleinstag eingesehen werden können. Der orwellsche Datensammler heißt archive.org und bietet über seine Wayback Machine genau diesen Service an. Das mögen Sie nicht? Dann sperren Sie Ihre Domain für dessen Bot. Und so geht's:

  1. Erstellen Sie - wenn noch nicht vorhanden - eine Textdatei mit Namen 'robots.txt'.
  2. Schreiben Sie die folgenden zwei Zeilen hinein:
    • User-agent: ia_archiver
    • Disallow: /
  3. Laden Sie diese Datei via FTP-Transfer in das Hauptverzeichnis Ihres Webspace hoch.

Das war's. Diese Maßnahme greift mit sofortiger Wirkung. Alle bisher gespeicherten Versionen Ihrer Seite bleiben zwar entgegen der Beteuerung des Betreibers auf www.archive.org erhalten, können jedoch nicht mehr abgerufen werden. Und es werden fortan keine neuen Speicherungen von Abbildern Ihrer Domain durch archive.org vorgenommen. Dieses kann auch dann bedeutsam sein, wenn von Ihrer Seite eine Urheberrechtsverletzung ausging, deren Behebung erforderlich war. Der 'Law Vodcast' der Kanzlei Dr. Bahr erkennt in der derzeitigen Rechtssprechung eine Verpflichtung des Verletzers, rechtswidrige Inhalte auch von fremden Internetseiten zu beseitigen - die Frage der Zumutbarkeit würde in jedem Einzelfall zu entscheiden sein. Die Entfernung aus 'archive.org' gehöre dazu. Die vollständige Entfernung vorhandener Abbilder müsste also zusätzlich zur Blockierung via 'robots.txt' per Email (info [at] archive.org gefordert werden. Sollten Sie später eine bereits gespeicherte ältere Version einsehen wollen, brauchen Sie diese beiden Zeilen nur wieder aus der Datei 'robots.txt' zu entfernen. Dies könnte beispielsweise hilfreich sein, wenn ein Kunde ungerechtfertigt die seinerzeit gültigen AGB Ihres Shops in Frage stellt. Oder eben aus nostalgischen Gründen.

(Eingestellt 2008)






Hinter den
Kulissen
unserer Welt


Sterbeforschung





Hinter den
Kulissen
unserer Welt


Intuition & Träume



Hinter den
Kulissen
unserer Welt


Einführung in die Metaphysik





Gefährliche
Lebensmittel-
Zusatzstoffe


E-Nummerliste der Lebensmittel-Zusatzstoffe mit Risikobewertung





Zitate
und
Weisheiten


Zeitkritische Zitate & kleine Weisheiten





Frei
von
Allergien


Allergien:
Beschwerdefrei ohne Medikamente