WCM Forum

WCM Forum (http://www.wcm.at/forum/index.php)
-   Internet (http://www.wcm.at/forum/forumdisplay.php?f=8)
-   -   robots.txt (http://www.wcm.at/forum/showthread.php?t=86106)

sleipner 29.01.2003 08:39

robots.txt
 
Ich verwalte eine Webseite bei der sich im Laufe der Zeit ziemlich viel Muell angesammelt hat. Leider bin ich gezwungen, ihn dort liegen zu lassen, weil er nicht mir gehoert.

Was ich jetzt gerne moechte ist, dass Suchmaschinen alles bis auf 2 Unterverzeichnisse ignorieren. Als Loesung hab ich mir das so vorgestellt...

# robots.txt for http://www.eco-lighthouse.com/

User-agent: *
Disallow: /
Allow: /english/
Allow: /deutsch/

Das 'Allow' ist zwar nicht definiert, laut SelfHTML wir es aber trotzdem von den meisten Suchmaschinen verwendet. Die Frage ist jetzt, ob ein 'Allow' die vorherigen 'Disallow' ueberschreibt.

K@sperl 31.01.2003 17:58

Probier mal den robots.txt validator:
http://www.searchengineworld.com/cgi-bin/robotcheck.cgi

schichtleiter 01.02.2003 17:45

Zitat:

Original geschrieben von Flanders
Probier mal den robots.txt validator:
http://www.searchengineworld.com/cgi-bin/robotcheck.cgi

hmmm... ich bin vor kurzem im netz auf eine solche robots.txt gestossen :

Code:

FUCK OFF !
:lol:
Hat hier jetzt einfach rein müssen :rolleyes:


Alle Zeitangaben in WEZ +2. Es ist jetzt 03:30 Uhr.

Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
© 2009 FSL Verlag