Jeanluc
lundi 26 décembre 2005 à 16:35
CITATION(anorci @ lundi 26 décembre 2005, 16h07)
Pour moi la syntaxe interdit la page : boutique.php?s= et seulement celle-là.
Beaucoup le croient, mais ce n'est pas ce que dit la spécification. J'ai essayé d'expliquer ici :
http://www.annuaire-info.com/robots/txt.htmlTu as raison de dire que le standard
robots.txt n'acceptent pas les expressions régulières, mais il compense cela, dans une certaine mesure, en considérant que ce qui est indiqué après un
Disallow: est le
début d'une URL interdite.
Donc, dans le deuxième exemple, pour être rigoureux, j'aurais dû écrire
CODE
Disallow: /boutique.php?s=cette-valeur-ci
interdit l'accès à toutes les URL qui
commencent par
/boutique.php?s=cette-valeur-ci, comme :
-
/boutique.php?s=cette-valeur-ci-
/boutique.php?s=cette-valeur-ci2-
/boutique.php?s=cette-valeur-ci&couleur=rougePour compliquer tout ça encore un peu plus, quelques robots acceptent des extensions du standard avec support des caractères spéciaux "*" et "$"
Jean-Luc