www.uli-arndt.de
www.uli-arndt.de
Help - Files vor Robots schützen?
Antwort

Geht mit dem Robots Exclusion Standard, nach dem man ein Textfile namens robots.txt erstellt und dieses im Root-Directory der Domain plaziert (z.B. http://www.uli-arndt.de/robots.txt).

Aufbau der 'robots.txt'

1.Angabe (User-agent) für welchen Robot gelten die Anweisungen
2.Angabe (Disallow) die Anweisungen.

Beispiel

# robots.txt fuer http://www.www.uli-arndt.de/
#
User-agent: Robot_1
Disallow: /stats/       # Files im Dir 'stats' nicht indizieren
Disallow: /php/         # Files im Dir 'php' nicht indizieren
Disallow: /private.html # geht niemanden was an

Erläuterung

User-agent: Robot_1
==> Anweisungen gelten nur für Robot_1
User-agent: Robot_1
User-agent: Robot_2
User-agent: Robot_3
==> Anweisungen gelten für die Robots 1,2 und 3
User-agent: *
==> Anweisungen gelten für alle Robots

Disallow: /temp/
==> temp nicht indizieren
Disallow: /
==> keine Seite indizieren
Disallow:
==> alle Seiten indizieren

Häufige Fehler beim Setzen des Slash

Disallow: /temp
==> Verbietet Robots den Zugriff auf das Directory temp, aber auch auf Directories, die mit temp beginnen, sowie auf Files wie z.B. template.html.

Mehrfach-Angaben

# robots.txt fuer http://www.www.uli-arndt.de/
#
User-agent: Robot_1
Disallow: /

User-agent: Robot_2
User-agent: Robot_3
Disallow:

User-agent: *
Disallow: /php/
Disallow: /private.html # geht niemanden was an

==> Die Anweisungen für '*' werden nur von Robots interpretiert, die nicht zuvor angegeben wurden.
==> Die Robots 1,2 und 3 missachten die Angaben für '*'.
==> Robot 1 darf nichts indizieren
==> Robots 2 und 3 dürfen alles indizieren
==> alle anderen Robots dürfen alles indizieren, außer den Files im Directory php und das File private.html.

Sonstiges

Kommentare beginnen mit dem Zeichen '#' und werden von den Robots überlesen.
Groß-/Klein-Schreibung muss bei der Disallow-Angabe nicht beachtet werden.
zurück
Das direkte Verlinken oder Kopieren von Inhalten oder Auszügen von Inhalten oder Bildern meiner Seiten ist ohne meine ausdrückliche Zustimmung nicht gestattet.