Jump to content
Sign in to follow this  
the_ydyd

Probleme d'indexation : Google ne met pas à jour son index

Rate this topic

Recommended Posts

Bonjour,

je m'occupe actuellement du référencement d'un site qui a été totalement refait. Cela fait plus d'un mois que le site est en ligne et disponible et Google n'a pas encore mis à jour son index, c'est à dire qu'il a en mémoire les anciennes pages du site. Est ce normal? Je comptais que google envoie ses crawlers, scanne en entier le site et remet à jour son index pour les retirer. mais apparamet non. Est ce normal pour une refonte complète de site ?

En cliquant sur ses anciens liens, utilisateurs et crawlers tombent sur une page 404 (bien sur, elle est customisé avec le plan du nouveau site) mais ce n'est pas vraiment classe pour générer du trafic de qualité.

Pourtant, je possède des backlinks, je suis inscrit dans les grands annuaires (Dmoz, etc) et je respecte les guidelines de Google.

Je suis inscrit dans le Google Webmaster tool, la dernière fois que le google est passé voir le site, c'était le 6 mai. Le problème (voir la faute) apparement, c'est que la fois ou Googlebot est passé, le site possédait la page "site en construction" (texte mis par un autre développeur de ma boite). Cette mention est elle vraiment préjudiciable pour que GoogleBot revienne ?

Savez vous en combien de temps Google met à jour son index? Supprime les anciennes pages de son index? y a til un moyen efficace pour faire revenir googleBot pour qu'il rescanne le site web ?

merci d'avance,

Share this post


Link to post
Share on other sites

Salut,

Que le site soit annoncé en construction n'est pas, en tant que tel, préjudiciable du point de vue du référencement.

Attends quelques semaines avant que Google ne supprime les anciennes pages de ton site de son index.

Un moyen efficace pour faire revenir GoogleBot ? Place un lien vers une des pages de ce site dans ta signature sur le forum du Hub, tu verras que le robot passera aussitôt. ;)

Share this post


Link to post
Share on other sites
Un moyen efficace pour faire revenir GoogleBot ? Place un lien vers une des pages de ce site dans ta signature sur le forum du Hub, tu verras que le robot passera aussitôt. ;)

Sauf que les signatures ne sont pas vues par les moteurs pour les nouveaux membres. Cela évite le spam de signatures... :P

Share this post


Link to post
Share on other sites

Tu devrais mettre en place des redirections 301 des anciennes pages vers les nouvelles plutôt que de proposer du 404.

Cela permet de mettre à jour plus rapidement l'index des moteurs tout en transmettant une partie de l'ancienne popularité de la page vers la nouvelle et donc d'atténuer le passage à ta nouvelle version du site.

Le must c'est toutefois de gérer correctement les URL de manière pérenne.

Edited by yep

Share this post


Link to post
Share on other sites
Que le site soit annoncé en construction n'est pas, en tant que tel, préjudiciable du point de vue du référencement.

D'après cet article , leur propos contredit tes dires (j'ai lu cet article bien après la mise en ligne du nouveau contenu malheuresement). De plus, lorsque je tape le nom de la marque associé du site sur google, j'ai l'ancien titre du site avec comme cache "site en construction" donc si un internaute voit ça dans Google, ça m'étonnerait fortement qu'il clique sur le lien étant donné qu'il croit que le site est en construction.

Share this post


Link to post
Share on other sites

Je ne suis pas certain que cet article contredise ce que j'avance.

En revanche, ce qui est sûr, c'est qu'il y a amalgame.

Le rédacteur assimile la page en construction à une page sans contenu. Entre nous, une page dite en construction ne constitue pas de fait une page sans contenu, en tous cas ce n'est pas comme cela que je l'entendais. Il ne m'a pas semblé nécessaire de le préciser, étant donné que chacun aura compris qu'une page en construction peut comporter un minimum de contenu, et c'est en ce sens qu'il est tout de même bon de la soumettre même si elle n'a pas atteint sa forme définitive.

Sur ce point, je maintiens mes propos.

Ensuite, par rapport au titre de ta page, le fait que le titre du résultat ne motive pas particulièrement l'internaute à visiter ton site est un autre problème. Mais puisque tu en parles, note que rien ne t'oblige à titrer "Page en construction" une page en cours de réalisation. ;)

Edited by karnabal

Share this post


Link to post
Share on other sites

oui, tout à fait exact, dans ce cas là, je suis d'accord avec ta remarque. Le developpeur qui a fait la refonte a eu le malheur de changer les anciennes pages par une page sans contenu avec juste marqué "site en construction". La page a été laissé pendant un jour et google est passé dessus et n'est aps revenu depuis, la boulette donc.

Donc apparement, si j'ai bien compris, il faut que je prenne mon mal en patience et que j'attende que Google veuille bien revenir... Mon boss va etre content de lui dire ça. Y a t il des choses à faire pour le faire revenir plus vite? Multiplié les backlinks? (précision : j'ai bien remis les redirections 301).

merci d'avance,

Share this post


Link to post
Share on other sites

Dans les outils de webmaster proposés par Google (si tu possèdes un compte Google) tu as la possibilité de modifier la vitesse d'exploration de ton site, mais n'attends pas de miracle de cette fonction.

D'un point de vue plus général, en matière de référencement naturel apprends à compter en mois plutôt qu'en semaines. ;)

Share this post


Link to post
Share on other sites

j'ai le même problème, lorsque je cherche mon site sur le moteur de recherche google, j'ai encore la page d'hébergement de mon hébergeur.

Je n'avais jamais ajouté mon site sur google, hier je l'ai ajouté et j'ai vu dans les stats qu'un robot est passé.

Google va t'il remettre à jour le titre et la présentation de mon site ?

Share this post


Link to post
Share on other sites
j'ai le même problème, lorsque je cherche mon site sur le moteur de recherche google, j'ai encore la page d'hébergement de mon hébergeur.

Je n'avais jamais ajouté mon site sur google, hier je l'ai ajouté et j'ai vu dans les stats qu'un robot est passé.

Google va t'il remettre à jour le titre et la présentation de mon site ?

oui et oui. En fait depuis ce matin, j'ai enfin appris que mon site a subi un full crawl (et non un fresh crawl) de Google Bot le 3 juin (le précédent était le 6 avril). Il a mis à jour son index et la mention "site en construction" a disparu. Donc mon probleme est réglé.

J'ai effectivement mis en place les redirections 301 qu'il fallait et développer ma politique de netlinking pendant ces derniers jours. Est ce que c'est ça qui a réglé le problème, je ne sais pas mais il faut comprendre le principes du référencement de GoogleBot :

  • le "fresh crawl" ("tous les deux trois jours"): Googlebot vient voir vos pages en sautant de liens en liens. Il regarde si le contenu a changé. Si c'est le cas, hop, il met à jour sinon, il suit d'autres liens externes. Il n'explore pas le site en suivant les liens internes. Si la page renvoie l'erreur 404, la, il s'arrete et ne fais rien (si vous avez choisit de mettre en place une page 404 customisé, c'est la meme chose).

  • le "full crawl"(tous les mois à peu près) : Googlebot explore plus en profondeur le site (sauf si barriere technologique comme du javascript, ou autre). Je pense que c'est à ce moment là qu'il rajoute de nouvelles pages à son index. Peut etre aussi qu'il met à jour le changement des page, peut etre aussi le cache.

Ce qui est sur, c'est qu'il faut attentre, mettre en place les bonnes pratiques de SEO mais GoogleBot revient te voir si tu es populaire et/ou si tu lui cause bien avec ton site (si tu facilites l'entrée de ses bots et respectes bien ses guidelines).

Share this post


Link to post
Share on other sites

Bonjour,

Mon site est toujours indexé dans son ancienne version sur Pagerank.fr...de plus Thumbshot affiche encore l'ancienne version...

Alors que sa fait une semaine que le site à changé, de plus pendant 2jours mon nom de domaine a été inaccessible...

Que deverais-je faire pour faire référencer la nouvelle version de mon site ?

Share this post


Link to post
Share on other sites

Salut,

visiblement, tu as à peu près le même problème que moi. Le mieux est que tu reprennes les conseils évoqué plus haut, à savoir :

  • mettre en place des redirections 301 de tes anciennes pages vers tes nouvelles
  • pratiquer les bonnes méthodes de SEO
  • développer la politique de netlinking

De plus, tu as un problème de nom de domaine accesible. Je te conseille vivement de vérifier constamment que ton dns est accessible, car les fresh crawl de Google sont la aussi pour vérifier si un site est effectivement accessible en tout temps (qualité de service pour un internaute lambda).

Après tout ça, il faut attendre,car la, les paramètres de venue des crawlers sont très floues, voir inconnues.

Share this post


Link to post
Share on other sites
Sauf que les signatures ne sont pas vues par les moteurs pour les nouveaux membres. Cela évite le spam de signatures... :P

Oui, c'est vrai, je viens de vérifier sur les pages en cache de google... comment réussis tu à faire ça ?

Edited by metakagoule

Share this post


Link to post
Share on other sites

En éditant les sources... tout simplement :whistling:

Les signatures ne sont visibles que pour les membres ayant plus de 20 posts non modérés ainsi qu'une adresse email valide :!:

Share this post


Link to post
Share on other sites
En éditant les sources... tout simplement :whistling:

Oui j'imagine que tu es un sacré "modifieur" de script ;)

Ce qui m'étonne en fait, c'est que finalement le moteur ne voit pas la même chose que l'internaute. Et ça me semble plutôt "magique", si j'arrivais à faire ça je pourrais par exemple faire en sorte que le texte de bienvenue de mon blog (présent sur toutes les pages) soit ignoré par les moteurs et donc augmenter la proportions de contenu original et ciblé sur chaque page. Franchement je ne savais pas qu'on pouvait faire des trucs comme ça.

Heu... quel est le principe grosso-modo ? sans révéler le code si tu n'y tiens pas

Par exemple sur cette page en cache sur google, il n'y a aucun lien en signature, alors que sur la page originale ont voit apparaitre les liens :?:

Edited by metakagoule

Share this post


Link to post
Share on other sites

Sur la page que tu cites (le cache date du 3 juin), il n'y a aucun lien parce que je venais de passer Invision à la version 2.2.2 la veille et que je n'avais pas encore fait les "modifs habituelles" sur le Hub. :)

Et, comme sur toutes les versions d'Invision, les liens ne sont pas montrés aux moteurs (par développement), tout ce que Google a mis en cache ce jour là ne coporet aucune signature.

Sur le Hub, j'ai modifié les sources pour que les moteurs puissent voir les signatures. Il te suffit de surfer avec un User_Agent égal à celui de Googlebot pour t'en rendre compte.

Seulement, ce type de modification se répand très vite sur le Net, et attire bien évidemment les spammeurs de tout poil.

C'est pour cette raison que les signatures des nouveaux membres, des bannis, et des membres ayant une adresse email invalide sont invalidées pour les moteurs.

Invision se base sur le User_Agent, et c'est vraiment simple à faire...

PS: le post originel sur lequel ce problème a été abordé se trouve à cette page (il date de plus de 3 ans): http://www.webmaster-hub.com/index.php?showtopic=3342

Share this post


Link to post
Share on other sites

Merci de ta réponse

C'est tout de même étonnant que le script d'origine d'invision board utilise une forme de cloacking (technique déconseillé par google) :(

En tout cas c'est vraiment louable de ta part d'avoir modifié le script de manière "intelligente" et ainsi d'offrir des liens en dur à tes membres.

Sur mon forum (phpbb), j'ai placé une balise nofollow sur les liens des messages et des signatures, non pas par peur d'une fuite de PR, mais parcqu'au petit matin je trouvais sur le forum des listes de liens vers des sites glauques : porno, viagra et tout le tintoin :wacko: .... En effet, pour simplifier l'inscription je ne demande pas l'activation par e-mail (c'est un choix). J'ai pensé que de telles farm-links vers des sites foireux ne me feraient pas que du bien aux yeux des moteurs. Il semble qu'aujourd'hui mon problème soit résolu grace à un mod récement installé (exit les spam anglophones :P ). Je vais peut-être retirer la balise nofollow, cela dit dans mon cas cela n'a pas vraiment d'importance, mes membres ont plutôt tendance à mettre une citation dans la signature ;)

Share this post


Link to post
Share on other sites

Tu n'as pas demandé l'activation du compte par email ? Pas étonnant dans ce cas que tu aies des posts vers des sites glauques !

Sur le Hub il y a un captcha, une validation email et un module qui permet de supprimer (rendre invisible au public) tout post ressemblant à du spam. Plus le fait que les signatures sont masquées au début.... et malgré cela on a tout de même eu à subir une attaque en règle de spammeurs le mois dernier.

Share this post


Link to post
Share on other sites

Moi aussi j'ai un gros problème d'indexation sur mon blog Rakabulle : http://kewiweb.com/ . L'index qu'apparaît dans la recherche sur Google date du 21/01/2014, une semaine. Je ne comprends pas d'où vient le souci. Il lui faut aussi longtemps à GoogleBot d'indexer les pages ?


Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
Sign in to follow this  

×
×
  • Create New...