Aller au contenu

Diminution en masse du nombre de pages indexées


real34

Sujets conseillés

Bonjour,

Je suis en charge d'un site internet proposant des normes à la vente. Jusqu'à présent, celui-ci proposait environ 8000 normes et le nombre de pages référencées augmentait petit à petit (>1500) ce qui me semblait normal au sens où le principal moyen de toutes les référencer est de passer par un sitemap.xml.

Néanmoins, dans le cadre d'un nouveau partenariat le nombre de normes proposé a doublé (16800 normes). Depuis cette date, le nombre de pages indexées diminue à vue d'oeil (470 actuellement) d'une manière très inquiétante.

Il y a (d'après mes conclusions) deux phénomènes pouvant avoir engendré un problème :

* Ayant ajouté les nouvelles normes en même temps au sitemap, un nombre important de contenu (liens) a été ajouté rapidement

* Notre page de recherche (utilisant une librairie PEAR pour la gestion de la pagination et ayant une requête assez complexe à effectuer) met un temps énorme à répondre dans le cas de l'affichage de toutes les normes. Conséquence, dans Google Webmaster Tools tous les accès à ces pages listant tous les articles (actuellement 240, mais potentiellement 16800 articles / 20 par page = 840) indique "délai dépassé" ...

J'aurai souhaité votre aide pour savoir ce qui aurait pû être la cause de cette chute vertigineuse et si vous voyez une solution :

* Dois-je augmenter petit à petit le nombre d'urls du sitemap ?

* Dois-je exclure l'url de recherche avec chaine vide par robots.txt ?

* Le nombre de page remontera-t-il rapidement par la suite ?

* ... dans tous les cas améliorer la gestion de cette page de recherche me semble être primordial

Merci d'avance pour votre aide.

Lien vers le commentaire
Partager sur d’autres sites

Il me semble surtout que tu devrais revoir ta requête, voire ta base de données. Une page de recherche, limitée à 20 résultats, ne devrait pas être si longue à répondre. On pourrait avoir un lien (éventuellement en MP) ?

La mise en cache des pages pourrait être une solution également.

Lien vers le commentaire
Partager sur d’autres sites

Je pense qu'il est important de corriger ce soucis de délai dépassé...

D'autre part, vérifie si tu n'est pas victime d'un phénomène de duplicate content, en testant la similarité de tes pages...

J'ai connu un soucis de baisse de nombre de pages indéxés sur google, et le responsable était le contenu qui semblais parfois similaire d'une page à l'autre...

Lien vers le commentaire
Partager sur d’autres sites

Merci à vous deux pour vos réponses,

Il me semble surtout que tu devrais revoir ta requête, voire ta base de données. Une page de recherche, limitée à 20 résultats, ne devrait pas être si longue à répondre. On pourrait avoir un lien (éventuellement en MP) ?

La mise en cache des pages pourrait être une solution également.

Oui, merci je vais quoi qu'il arrive travailler là-dessus car c'est vraiment affreux ... je ne pensais pas qu'une augmentation du nombre de norme fasse un tel effet :/

Je t'ai envoyé quelques informations supplémentaires en MP.

Je pense qu'il est important de corriger ce soucis de délai dépassé...

D'autre part, vérifie si tu n'est pas victime d'un phénomène de duplicate content, en testant la similarité de tes pages...

J'ai connu un soucis de baisse de nombre de pages indéxés sur google, et le responsable était le contenu qui semblais parfois similaire d'une page à l'autre...

Concernant le duplicate content, j'ai normalement essayé de différencier au maximum les pages de chaque norme (description, titre et mots-clés fortement liés au descriptif du document).

Néanmoins pour les pages de recherche, il n'y a pas de différence ... je vais peut-être rajouter un titre contenant la requête ou quelque chose comme cela !

Par contre, connaitrais-tu un bon outil permettant de vérifier le duplicate content ? (Google WT ne me fait rien remonter de dramatique)

Lien vers le commentaire
Partager sur d’autres sites

Bonjour,

Après ma séance de travail du matin je suis parvenu à optimiser ma requête SQL de recherche et l'affichage de la page est nettement plus rapide. Le soucis de délai dépassé pour google devrait disparaitre.

Si ce n'est qu'une question de temps il n'y a aucun problème, mais j'aimerai votre avis pour savoir :

1 - Si il faut que je regarde d'autres choses (notamment comment déterminer le duplicate content de manière précise)

2 - Combien de temps pensez-vous que cela prenne pour que Google se rende compte de son erreur ultime (:D) et ré-indexe mon site ?

Merci d'avance pour vos informations !

Pierre

Lien vers le commentaire
Partager sur d’autres sites

Bonjour,

Je vous confirme que le nombre de pages indexées est en hausse ... cela a semble-t-il résolu mon problème !

Merci pour votre aide, vous pouvez marquer ce message en résolu (ou m'indiquer comment l'éditer car je n'ai pas trouvé) si vous le souhaitez.

Pierre

Lien vers le commentaire
Partager sur d’autres sites

  • 2 semaines plus tard...

C'est parfait si tout remarche...

Du coup, tu pense que le coupable étais le délai de chargement de tes pages ou le degrés de similiarité de tes contenus...????

Lien vers le commentaire
Partager sur d’autres sites

Posté (modifié)

Bonjour,

En fait le délai de chargement des pages a fait de suite remonter le nombre de pages indexées (de 400 à 800), cependant depuis ce moment là le nombre de page stagne.

J'ai ensuite essayé de vérifier que toutes les requêtes été optimisées (une seule ralentissait pas mal d'autres pages).

Enfin j'ai ajouté des redirections 301 à certains endroits pour éviter que 2 urls différentes pointant vers le même contenu soient indexées. En effet j'ai des urls de type "article-ID-slug-du-nom-article" ce qui faisait qu'une infinité d'urls pouvaient pointer vers la même page. Par exemple "article-401-toto-tata" et "article-401-titi-tutu" et "article-401-t" pointaient vers la même page (seul l'id était significatif).

J'attends encore un peu pour voir si le nombre de pages indexées se remet à augmenter, mais sinon j'avoue ne plus savoir quoi faire ... sur 30000 articles, seuls 700 sont référencés :(

Modifié par real34
Lien vers le commentaire
Partager sur d’autres sites

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...