#1 (permalink)  
Alt 14.02.2007, 09:10
Neuer Benutzer
 
Registriert seit: 07.07.2005
Beiträge: 16
Beitrag robots.txt Disallow: popup_image.php

Hallo,

google listet trotz der robots.txt und dem Eintrag "Disallow: popup_image.php" groesstenteils sämtliche image popups. Scheinbar sogar mehr davon als die eigentlichen prudukt info seiten. Weiss jemand einen Rat, wie ich das unterbinden kann?

User-agent: steht nach wie vor auf "*"

gruß,

DiNO
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!Wong this Post!
Mit Zitat antworten
  #2 (permalink)  
Alt 20.03.2007, 10:13
osr osr ist offline
Erfahrener Benutzer
 
Registriert seit: 14.05.2005
Beiträge: 465
Standard

Versuchs mal mit 'Disallow: /popup_image.php'
Die Robots.txt kannste so komlett in die Tonne hauen.
Angeblich ist das schon seit Ewigkeiten auch dem Support bekannt.
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!Wong this Post!
Mit Zitat antworten
  #3 (permalink)  
Alt 20.03.2007, 10:14
Benutzerbild von mzanier
xt:Commerce GmbH, Geschäftsführung
 
Registriert seit: 18.04.2003
Beiträge: 27.414
Standard

das problem liegt aber eher darin, das sich fast keine suchmaschine an die robots.txt haltet.
__________________
xt:Commerce Helpdesk
xt:Commerce Blog

xt:Commerce Warenwirtschaft

###

Offene Stellen bei xt:Commerce!
xt:Commerce stellt ein
###
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!Wong this Post!
Mit Zitat antworten
  #4 (permalink)  
Alt 20.03.2007, 15:31
Erfahrener Benutzer
 
Registriert seit: 19.07.2006
Ort: Hamburg
Beiträge: 912
Standard

Zitat:
das problem liegt aber eher darin, das sich fast keine suchmaschine an die robots.txt haltet.
Google im Allgemeinen schon - nur ist da bei manchen Bots von Google die klitzekleine Einschränkung, dass sie gerne "persönlich" angesprochen werden wollen.

user-agent: * wird also von einigen Googlebots einfach ignoriert

user-agent: Googlebot sollte Google berücksichtigen!

Siehe Hilfe für Webmaster - Wie blockiere ich Googlebot?

...was mich am Gesamtkonzept der robots.txt viel eher stört, ist, dass ein "böser" Bot die ja auch lesen und dann munter alle Disallow-Einträge abklappern kann...

Cheers,
IaN
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!Wong this Post!
Mit Zitat antworten
  #5 (permalink)  
Alt 21.03.2007, 08:13
osr osr ist offline
Erfahrener Benutzer
 
Registriert seit: 14.05.2005
Beiträge: 465
Standard

Wir haben es vor ein paar Tagen getestet.
Es geht auch nur mit user-agent: *.
Das Geheimnis liegt im Slash vor den Dateinamen und Verzeichnissen.
Wir haben zusätzlich aber auch den Googlebot als Eintrag hinzugefügt.
Es empfiehlt sich auch Content Texte wie z.B. AGB zu sperren.
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!Wong this Post!
Mit Zitat antworten
  #6 (permalink)  
Alt 21.03.2007, 14:00
tuvalu
Gast
 
Beiträge: n/a
Standard

Zitat:
Zitat von osr Beitrag anzeigen
Wir haben es vor ein paar Tagen getestet.
Es geht auch nur mit user-agent: *.
Das Geheimnis liegt im Slash vor den Dateinamen und Verzeichnissen.
????

Du meinst, jedes Dissallow muss so aussehen?
Dissallow: /datei.php
Dissallow: /Verzeichnis/


Zitat:
Zitat von osr Beitrag anzeigen

Wir haben zusätzlich aber auch den Googlebot als Eintrag hinzugefügt.
Es empfiehlt sich auch Content Texte wie z.B. AGB zu sperren.
Sind gesperrt durch Dissallow: media/ aus der Standard-Robots.txt

tuvalu
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!Wong this Post!
Mit Zitat antworten
  #7 (permalink)  
Alt 21.03.2007, 15:10
osr osr ist offline
Erfahrener Benutzer
 
Registriert seit: 14.05.2005
Beiträge: 465
Standard

Jep.
Der Slash ist 'Norm'.
Siehe z.B. hier.

Das mit dem Media-Verzeichnis muß nicht unbedingt funktionieren,
da Content-Inhalte z.B. über 'shop_content.php/coID/1' erfolgen.
Und 'shop_content.php' liegt im root.
Ebenso der wird die popup_content.php indexiert.

Wenn du nicht zu viele Produkte hast solltest du das mal mit 'site:www.deineseite.de'
in der Google-Suchmaske testen.

Da hab ich z.B. gerade folgendes im Google-Index gefunden:
Versandkosten

Geändert von osr (21.03.2007 um 15:17 Uhr)
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!Wong this Post!
Mit Zitat antworten
  #8 (permalink)  
Alt 21.03.2007, 17:38
tuvalu
Gast
 
Beiträge: n/a
Standard

Zitat:
Zitat von osr Beitrag anzeigen
Jep.
Der Slash ist 'Norm'.
Siehe z.B. hier.
Ups.

Ist mir unklar, weshalb xt:C dann eine nichtkonforme robots.txt hat.

Zitat:
Zitat von osr Beitrag anzeigen
Das mit dem Media-Verzeichnis muß nicht unbedingt funktionieren,
da Content-Inhalte z.B. über 'shop_content.php/coID/1' erfolgen.
Und 'shop_content.php' liegt im root.
Ebenso der wird die popup_content.php indexiert.
Guter Einwand.

Zitat:
Zitat von osr Beitrag anzeigen
Wenn du nicht zu viele Produkte hast solltest du das mal mit 'site:www.deineseite.de'
in der Google-Suchmaske testen.

Da hab ich z.B. gerade folgendes im Google-Index gefunden:
Versandkosten
Jep, da sind bereits gut 1700 Einträge, unter anderem auch die Popup-Bilder, die ja gesperrt sein sollten.

Danke für den Hinweis.

Tuvalu
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!Wong this Post!
Mit Zitat antworten
Antwort

Lesezeichen

Stichworte
disallow, popupimagephp, robotstxt

Themen-Optionen
Ansicht

Forumregeln
Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are aus
Pingbacks are aus
Refbacks are aus


Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Shop In Keiner Suchmaschine marg Allgemeine Diskussionen 5 13.06.2005 07:11


Alle Zeitangaben in WEZ +1. Es ist jetzt 09:43 Uhr.

Copyright © 2011 xt:Commerce GmbH / xt:Commerce International Ltd. - All Rights Reserved

xt:Commerce is a SafeCharge brand