Jump to content

Recommended Posts

Posted

Les pros de la syntaxe du fichier robots.txt peuvent-ils confirmer que la ligne

Disallow: /a

permet d'empêcher l'indexation d'un répertoire commençant par la lettre "a" ?

J'ai trouvé des informations contradictoires à ce sujet.

J'ai aussi mis en place un petit test pour vérifier ceci en grandeur nature, mais en attendant le crawl, j'aurais bien aimé avoir vos avis !

Posted

Merci pour ta réponse.

Pour ce qui est des autres moteurs, je vous tiendrai au courant une fois que mon petit test aura pris.

Posted

Ton affirmation est exacte et pas seulement pour Google. Cela fait partie de la norme robots.txt qui date de 1994.

Disallow

The value of this field specifies a partial URL that is not to be visited. This can be a full path, or a partial path; any URL that starts with this value will not be retrieved.

Jean-Luc

Posted

Tu as raison, je pense toutefois que Google a ajouté la reconnaissance des wildcards dans les noms de répertoires.

Mais tous les moteurs reconnaissent les partiels.

Ou alors il faut que je me replonge dans la norme du robots.txt :(

Posted

Merci Jean Luc pour ta précision et ta référence.

Mon test ne servira alors qu'à vérifier si oui ou non les moteurs autres que Google respectent la norme.

Please sign in to comment

You will be able to leave a comment after signing in



Sign In Now
×
×
  • Create New...