Aller au contenu

Pourquoi google indexe mes index of ?


chouxe

Sujets conseillés

Bonjour,

J'ai un petit problème avec l'indexation de google.

Est ce que quelque saurait pourquoi il indexe mes pages indexe of ?

voici mes pages indexées : www.sos-chevaux.fr

En plus il rajoute des arguments comme pour la page suivante : www.sos-chevaux.fr/web/img/chevaux_pt/?C=M;O=D

Il indexe aussi une page : www.sos-chevaux.fr/web/traitement.php alors qu'aucun lien ne pointe dessus :(

Merci à tous....

clémentine

Lien vers le commentaire
Partager sur d’autres sites

Parce que Google crawl TOUTES les pages qui lui sont atteignables si celles-ci n'ont aucune restriction (meta, robots,...). Donc si ton dossier /web/img/chevaux_pt/ est accessible, depuis une page déjà indexée, Google va crawler la page. Pour remédier à ce problème, il faut soit spécifier dans un htaccess de générer une erreur 403 ou bien de mettre un index avec un noindex. Ou tout simplement un fichier robots à la racine.

Quant à la page /web/traitement.php, aucun lien présent sur ton site peut-être, mais d'autres sites peuvent avoir lié cette page, ce qui expliquerait sa présence dans l'index de Google. Sinon le mieux c'est de créer un dossier qui contient toutes les pages de traitement que tu ne souhaites pas les voir indexer et d'interdire ce dossier complet par robots.txt.

Lien vers le commentaire
Partager sur d’autres sites

Bonjour et bienvenue sur le hub,

Un seul lien mal construit peut entraîner l'indexation non souhaitée de nombreuses pages.

Exemple:

Sur [i]http://www.sos-chevaux.fr/web/img/'>]http://www.sos-chevaux.fr/web/img/chevaux_pt/?C=M;O=D'>]http://www.sos-chevaux.fr/web/img/'>]http://www.sos-chevaux.fr/web/img/chevaux_pt/?C=M;O=D,

il y a un lien "Parent Directory" vers [i]http://www.sos-chevaux.fr/web/img/'>]http://www.sos-chevaux.fr/web/img/

où il y a un autre lien "Parent Directory" vers [i]http://www.sos-chevaux.fr/web/

où il y a un lien "traietement.php" vers [i]http://www.sos-chevaux.fr/web/traitement.php.

Si tu ne veux pas que ces pages soient visitées par Google, utilise un fichier robots.txt ou protège l'accès par un mot de passe. Si tu acceptes que Google visite ces pages, mais que tu ne veux pas qu'elles apparaissent dans les résultats de recherche, utilise la balise meta "robots" avec "noindex".

Jean-Luc

Lien vers le commentaire
Partager sur d’autres sites

Ce type de lien avec ses paramètres était présent dans tes pages "index of". Examine le dessus des colonnes de ces pages et tu retrouveras ce genre de lien.

Jean-Luc

Lien vers le commentaire
Partager sur d’autres sites

Utilisation de Google Webmasters Tools:

Tableau de bord > Outils > URL à supprimer

Ou bien un fichiers robots.txt, ou bien ajouter une balise meta robot avec comme valeur noindex, ou encore retourner un header autre que 200.

Lien vers le commentaire
Partager sur d’autres sites

J'ai essayé d'utiliser l'outils google pour webmaster mais voici sa réponse : Refusé : Le contenu que vous avez envoyé pour la suppression du cache s'affiche sur une page tierce.

Est ce que si je mets dans mon fichier robots.txt les adresses telles que : www.sos-chevaux.fr/web/?C=M;O=A elles vont disparaitre de l'index ?

Lien vers le commentaire
Partager sur d’autres sites

Je ne crois pas que tu doives t'inquiéter de la présence de ces pages dans l'index Google.

Ces adresses sont actuellement redirigées vers la page d'accueil de ton site. Elles devraient donc disparaître automatiquement de l'index, mais c'est vrai que cela peut prendre du temps. De toute façon, peu d'internautes cliquent sur le lien "En cache" des résultats de Google. Je pense aussi que ces pages ne vont pas ressortir sur des recherches usuelles. En pratique, seuls les webmasters utilisent la commande site:.

Concernant la redirection utilisée, tu utilises malheureusement une redirection 302 vers /index.php. Un code 404 ou une redirection 301 vers / serait préférable.

Jean-Luc

Lien vers le commentaire
Partager sur d’autres sites

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...