Aller au contenu

Pages Ignorées par Google


AntiStatic

Sujets conseillés

Salut à tous !

j'aimerais vous soumettre une requete que je trouve pour le moins bizarre. Elle concerne mon comparateur de fleurs. Voila je suis a la ramasse sur toutes les requetes que je vise chez Google :angry:

Donc j'ai regardé de plus prés quelques requetes trés longues pour voir si mon site sortait quand meme et rien, nada, kenini, un gros vent du nord bien froid. Mais en poussant un peu j'ai remarqué qu'en fait mes pages etaient incluses dans les pages ignorées :blink:

Je prendrais juste pour exemple la requete : "livraison bouquet de fleurs à 25 euros" : http://www.google.fr/search?q=livraison+bo...&start=100&sa=N sur laquelle Google donne relativement peu de résultat : environ 8000. Sur cette requete malheursement je ne sors pas dans les 200 premiers résultats pourtant j'ai bien une section de bouquets à plus de 25 euros

Par contre si je relance la recherche en incluant les pages ignorées je trouve mon site dans les 500 premiers résultats : http://www.google.fr/search?q=livraison+bo...0&sa=N&filter=0 (ctrl+F : AAZ) :fou:

Je voulais donc savoir si quelqu'un avait une idée pour expliquer ca ? Car normalement les pages ignorées sont des pages similaires aux résultats déjà sortis nan ?

Merci pour votre aide ! A bientot sur le Hub ;)

Lien vers le commentaire
Partager sur d’autres sites

Aïe aïe ! Ca sent la désindexation... La commande site:www.aaz-fleurs.com renvoie 3740 pages pour ton site. Or beaucoup de ces pages sont des redirections de type www.aaz-fleurs.com/out/out.php?id=XX (il y en a des centaines)

Google les a indexé mais elles sont toutes identiques ou presque. Donc il estime que 60% ou 70% ou 80% (je ne sais pas, à toi de compter) de ton site est composé de pages identiques. Et ça il n'aime pas... pas du tout...

A ta place je mettre un noindex sur out.php

Le nombre de pages de ton site indexées par G va chuter énormément, par contre ce seront de vrais pages avec du contenu, pas des out.php de redirection. Et là, il risque d'aimer à nouveau ton site.

Voilà ce que j'essayerai à ta place...

Lien vers le commentaire
Partager sur d’autres sites

C'est bien ce que je dis .. je suis entre les 500 et 600 eme résultat mais en incluant les pages ignorées ! Alors que c'est pages ignorées ne sont normalement que des pages appartenant aux sites deja sortis dans la premiere recherche !

C'est ca que je ne comprend pas !

Lien vers le commentaire
Partager sur d’autres sites

ya deja un noindex, nofollow c le pages out .. et meme un robot.txt pour zapper le dossier /out/

Depuis combien de temps ? Le cache de pas mal de tes pages est du 15 février, et ce jour-là il n'y avait pas de noindex puisque tes pages ressortent en résultats. Attends la prochaine indexation, que G tienne compte du noindex. D'ici là, pour lui tu as des milliers de pages en duplicate content. Donc logiquement il te balance au fin fond du classement...

Enfin... c'est mon opinion !

Lien vers le commentaire
Partager sur d’autres sites

C'est bien ce que je dis .. je suis entre les 500 et 600 eme résultat mais en incluant les pages ignorées ! Alors que c'est pages ignorées ne sont normalement que des pages appartenant aux sites deja sortis dans la premiere recherche !

J'ai confondu les résultats avec et sans les pages ignorées... :huh:

C'est peut-être la ressemblance des textes de tes pages avec des pages d'autres sites qui entraîne ton passage en pages ignorées ?

Jean-Luc

Lien vers le commentaire
Partager sur d’autres sites

OK en fait j'ai Disallow mon dossier /out/ depuis le début de la mise en ligne de mon site ... ce qui m'etonnait c'est que justement c'est les premieres pages que Google à indéxé comme s'il était trop curieux et qu'il préférait alors voir ces pages "interdites" plutot que d'aller voir mes autres pages au contenu réél.

Mais la ou je ne capte pas c'est que ce n'est pas de ces pages dont je parle, ce sont toutes mes autres pages ! Enfin bref Google ca commence vraiment a devenir n'importe quoi .. vivement que MSN lui mette la paté :)

Car j'ai oublié de vous donner un détail : jusqu'au 15 février, lendemain de Saint Valentin qui etait une grosse période pour les fleurs, je faisais de l'adwords. Voyant que je commencais a faire plus d'entrées en référencement naturel qu'avec adwords, j'ai donc arrété ma campagne !

Et comme par hasard 10 jours plus tard impossible de sortir sur la moindre requete, meme les plus longues, et certaines pour lesquelles je suis le seul a avoir un contenu pertinent ! Vous me direz ce n'est surement qu'une coïncidence .. mais quand meme je trouve ca un peu gros !

Pour ce qui est de :

C'est peut-être la ressemblance des textes de tes pages avec des pages d'autres sites qui entraîne ton passage en pages ignorées ?
je ne vois pas comment cela pourrait être possible étant donné que normalement GG ignores les pages des sites qu'il a déjà sortis dans la premiere recherche.
Lien vers le commentaire
Partager sur d’autres sites

je ne vois pas comment cela pourrait être possible étant donné que normalement GG ignores les pages des sites qu'il a déjà sortis dans la premiere recherche.

Tu mélanges deux éléments. Le premier, classique, ce sont les pages que Google choisit de ne pas montrer parce qu'elles sont similaires à d'autres pages du site. Tous les webmasters connaissent ça depuis longtemps, ça n'est pas pénalisant pour le site. Il faut 'poursuivre la recherche' pour tout voir, OK.

Or je ne parle pas du tout de ça ! Je te parle d'un second phénomène, qui ne vise pas à montrer des résultats différents à l'internaute, mais vise à pénaliser le webmaster qui s'amuse à multiplier le nombre de pages sans contenu. Le site est alors renvoyé au fin fond du classement. C'est le cas du tien car tu as des centaines de pages out.php identiques ou presque. Tentative de création de contenu bidon... c'est comme ça que G voit tes redirections ! (à tort, on est d'accord).

Troisième élément, c'est celui dont parle Jeanluc. Je n'y ai jamais été confronté mais j'ai déjà lu ça sur d'autres forums SEO. Tes pages seraient (?) trop semblables à celles d'autres sites. Tentative de pages satellites... c'est comme ça que Google voit les choses.

Quatrième aspect, ton répertoire en Disallow qui est indexé quand même. Là aussi ce sont des problèmes abordés ici ou là, mais je ne sais pas trop comment t'aider. Pourtant je pense que c'est la source de tous tes problèmes, l'indexation de ces out.php ...

Bon courage.

Lien vers le commentaire
Partager sur d’autres sites

Oui je suis également d'accord, le pb vient peut être de ces pages out.php ! Encore que comme je le faisais remarqué plus haut ce n'ait pas de ces pages que je parles mais belle et bien de celles avec du contenu.

J'ai donc lancé une déindéxation massive de ces pages et du dossier out meme si effectivement mon robots.txt et mes meta noindex était déjà depuis le bédut de la mise en ligne de mon site.

En fait il y a une procédure express chez GG qui permet de spécifier les pages que tu ne souhaite plus voir dans leur résultat. Je verrais bien ce que ca donne !

Merci pour votre aide dans tous les cas ;)

Lien vers le commentaire
Partager sur d’autres sites

Yep !

ba deja la déindéxation de mes pages out a été super rapide !!! En moins de 24h elle ont toutes disparu des résultats de GG. Et cela meme avec la commande site:www.aaz-fleurs.com !

Pour ce que ca interesse cette procédure ce trouve ici : http://services.google.com:8882/urlconsole...d&lastcmd=login ;)

A bientot !

Lien vers le commentaire
Partager sur d’autres sites

Exact ! La commande site:www.aaz-fleurs.com indique toujours 3740 pages indexées mais il n'y a plus les out.php

Je vois 389 pages réellement indexées sur 3740, les autres sont considérées comme similaires, pas de problème. Par contre si je relance la recherche j'arrive à un total d'environ 12 100 provenant de www.aaz-fleurs.com

Donc question : sur ces 12000 pages (!) n'y en a-t-il pas des milliers quasi-identiques ? Ca fait beaucoup 12000 je trouve. Peut-être que les out.php sont dedans d'ailleurs...

Lien vers le commentaire
Partager sur d’autres sites

Yep MegaChercheur !

oui effectivement ! Mais le truc bizarre est justement que la commande site:www.aaz-fleurs.com me renvoi de temps en temps 12000 pages et la plupart du temps environ 3700 ... chose que je n'ai jamais compris.

Je pense donc que le nombre réél de pages indéxées par GG tourne autour des 3700 ! Par contre une chose intéressante à noter ici : c'est qu'avant de faire la demande déindexation de mes pages out.php à GG j'avais toujours 3700 pages !

Donc a priori le comptage de ces pages ne prennait pas en compte avant les pages que j'avais bel et bien zappé avec le robots.txt et le tag NOINDEX. Par contre il les affiché pour une raison inconnue.

Mais j'aimerais bien savoir pourquoi GG jongle entre 3700 et 12000 pages indéxées. Ca me fait ca depuis plus d'un mois c plutot étrange je trouve ...

Lien vers le commentaire
Partager sur d’autres sites

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...