Aller au contenu

Google site map et redirection 301


fedorax

Sujets conseillés

Aujourdh'ui je trouve ça dans mon site map ( Vu les dates on voit que les mises à jour sont assez lentes ):

---------------------------------------------------

--http://www.bouquinique.com/html/ Web 404 introuvable déc. 1

--http://www.bouquinique.com/html/D.php Web 404 introuvable déc. 3

--http://www.bouquinique.com/html/L.php Web 404 introuvable nov. 28

--http://www.bouquinique.com/html/O.php Web 404 introuvable nov. 28

------------------------------------------------------

Pourtant toutes les pages citées ci-dessus sont redirigées correctement en 301 ( L'étaient aussi à la date indiquée ) et mes stats montrent que google est bien tombé sur les nouvelles pages. Ca me laisse perplexe. Que prend t-il en compte maintenant? l'url avant redirection ou après redirection ?

A part ça il n'a pas encore mis le nez dans les pages indiquées dans le site map.

Lien vers le commentaire
Partager sur d’autres sites

Tu envoies à Google des pages qui n'existent pas, en espérant qu'il suive les redirections.

Très bien, il t'informe qu'il n'a pas trouvé les pages. Reste à savoir s'il a suivi la redirection, tu nous en diras plus plus tard :D

Cependant, jettes un oeil à cette page, et essaies de voir ce qui cloche :

http://www.google.fr/search?q=+site:bouqui...coff=1&filter=0

Un indice : Que penses tu de ce que voit Google, lorsqu'il a un site comme ceci ?

;)

Lien vers le commentaire
Partager sur d’autres sites

Pourtant toutes les pages citées ci-dessus sont redirigées correctement en 301 ( L'étaient aussi à la date indiquée ) et mes stats montrent que google est bien tombé sur les nouvelles pages. Ca me laisse perplexe. Que prend t-il en compte maintenant? l'url avant redirection ou après redirection ?

<{POST_SNAPBACK}>

franchement je ne comprend pas pourquoi tu donnes l'ancienne adresse dans ton sitemap en esperant que Google va suivre la redirection ... le fichier sitemap est fournis par le webmaster (et non trouvée par un robot) et le webmaster est sensé savoir quelles sont les bonnes adresses de ses pages ... :whistling:

Modifié par cendrillon
Lien vers le commentaire
Partager sur d’autres sites

Cependant, jettes un oeil à cette page, et essaies de voir ce qui cloche :

http://www.google.fr/search?q=+site:bouqui...coff=1&filter=0

Ce qui cloche je le vois tout de suite en lisanr:

" Cette version HTML du catalogue n'est utile qu'en cas d'indisponibilité ... "

dans tous les en-têtes. Ce sont des pages qui traînent dans google depuis début 2004 et qui qui n'ont jamais disparu quoi que je fasse.

Si tu fais site:bouquinique.com bouquinique com html A php pour les quelques pages qui traînent dans le cache tu verras: extraite le 19 juil 2005 20:33:30 GMT.

Ce n'est d'ailleurs pas mieux sur d'autres moteurs. Ils indexent les nouvelles pages mais laissent traîner les vieux tromblons de 2003 dans leur index.

Un indice : Que penses tu de ce que voit Google, lorsqu'il a un site comme ceci ?

Je pense la même chose que toi mais que veux-tu que j'y fasse ? J'ai envoyé 3 mails depuis début novembre quand je me suis aperçu du bazar. J'ai déplacé toutes les pages ( D'ou les 301 ) en espérant que ça ferait disparaître les verions périmées.

J'ai fait un rewrite pour éviter le mélange http et http://www. ( Ca au moins ça à l'air d'avoir marché, si tu fais le même test avec les www il ne sort presque plus de vieux trucs.

Je ne vais quand même pas m'immoler par le feu ? En plus si je lis bien tous les messages ici ou ailleurs le problème est général et il m'arrive parfois de cliquer sur des liens google ( Ou autre moteur de recherche ) et de tomber sur un 404 parceque le site est fermé depuis 2 ans....

Lien vers le commentaire
Partager sur d’autres sites

franchement je ne comprend pas pourquoi tu donnes l'ancienne adresse dans ton sitemap en esperant que Google va suivre la redirection ... le fichier sitemap est fournis par le webmaster (et non trouvée par un robot) et le webmaster est sensé savoir quelles sont les bonnes adresses de ses pages ... :whistling:

<{POST_SNAPBACK}>

??? Mais je n'ai jamais mis les anciennes adreses dans le sitemap. J'ai bien mis les nouvelles et c'est jiustement ça que je ne comprend pas:

Je mets les nouvelles adresses dans le site map et il me renvoie des erreurs sur des pages qui n'existent plus et ne sont pas dans le site map.

Lien vers le commentaire
Partager sur d’autres sites

??? Mais je n'ai jamais mis les anciennes adreses dans le sitemap. J'ai bien mis les nouvelles et c'est jiustement ça que je ne comprend pas:

Je mets les nouvelles adresses dans le site map et il me renvoie des erreurs sur des pages qui n'existent plus et ne sont pas dans le site map.

<{POST_SNAPBACK}>

ah ... j'avais pas compris ça ... je pense que c'est parce qu'il reste encore des liens vers ces pages (depuis ton site ou d'autres sites) : en fait j'ai l'impression que l'interface admin Sitemap est en train de devenir une sorte de console d'administration générale qui renvoi (presque :) ) toutes sortes d'informations sur le site (mots clés, statistiques de clicks, pages non accessibles et je pense plein d'autres choses à venir) ... d'ailleurs c'est logique : c'est la seule interface au travers de laquelle Google peut communiquer ce genre d'informations aux webmasters ...

Modifié par cendrillon
Lien vers le commentaire
Partager sur d’autres sites

Si google a gardé les anciennes urls, il n'y a pas grand chose à faire pour les enlever, sinon attendre qu'elles disparaissent d'elles mêmes.

Les redirections, c'est une bonne idée, sauf que google prend en compte les nouvelles pages avec les anciennes urls, ce qui n'arrange rien.

Si ces nouvelles pages sont correctement indiquées, sur le site comme dans le sitemap, alors tu peux très bien faire une redirection vers une page erreur 404, au moins il comprendra qu'il n'y a rien à cette adresse, et il te libèrera tes nouvelles pages, avec les nouvelles adresse. Ca il y a fort à parier que ces nouvelles pages soient bloquées pour 'duplicate content' avec les anciennes.

Sinon, idem :

j'avais compris comme Cendrillon...

Lien vers le commentaire
Partager sur d’autres sites

Ce qui manque c'est une interface qui permette au web master de communiquer avec les moteurs... Apparament même les liens donnés dans ggogle pour faire sortir une page périmée ne donne rien.

Un exemple de déchet qui traîne depuis 2003:

Le cache

La page indexée

C'est un autre de mes sites ( Négligé depuis 2004 ) Vu l'erreur de bdd que je lis dans le source cette page traîne depuis dec 2003 date à laquelle j'avais refait la bdd.

Lien vers le commentaire
Partager sur d’autres sites

Pour supprimer les URLs indésirables de l'index de google, tu peux renseigner le fichier robots.txt ou la balise meta robots: http://www.google.fr/webmasters/remove.html

Si tu veux que ça aille vite, tu peux même utiliser l'interface de google: http://services.google.com:8882/urlconsole...d&lastcmd=login

Lien vers le commentaire
Partager sur d’autres sites

Pour supprimer les URLs indésirables de l'index de google, tu peux renseigner le fichier robots.txt ou la balise meta robots: http://www.google.fr/webmasters/remove.html

Si tu veux que ça aille vite, tu peux même utiliser l'interface de google: http://services.google.com:8882/urlconsole...d&lastcmd=login

<{POST_SNAPBACK}>

Le robots.txt sur des pages qui n'existent plus et sont redirigées par une 301 je ne sais pas ce que ça pourrait donner. Possible que ça me bloque définitivement les nouvelles pages.

La seconde solution c'est sans doute celle que j'aurais du appliquer dès que j'ai vu que google crawlait mes pages sans les remettre dans l'index mais j'ai horreur des trucs que je ne comprend pas et ça m'a poussé à essayer autre chose. Faute de mieux j'aurais acquis qq. connaissances dans un domaine ou j'ignorais presque tout.

Pour l'instant comme il est spécifié dans la doc que la solution 2 ne fonctionne que sur des vraies 404 ça ne pourra pas marcher tant que les 301 seront actives et j'en ai besoin le temps que les autres moteurs indexent les nouvelles pages. ( Sur ce coup MSN est vraiment rapide, une bonne partie est déjà indexée, yahoo semble suivre de près ) Sitôt que tout sera clean dans les autres moteurs je vire les 301, j'essaie de faire sortir les vielles pages de google et après il fera bien ce qu'il veut. Il est passé hier sur les nouvelles pages via les 301, si je m'aperçois qu'il réindexe les anciennes ou qu'il n'indexe rien soit je laisse tomber, soit je pète une durite !

Quoi qu'il en soit je ferais une brève page web résumant l'aventure qaund tout sera fini.

Lien vers le commentaire
Partager sur d’autres sites

Quand j'ai installé sitemap, j'ai vu que google faisait des 404 sur des pages qui n'existent plus depuis presque 1 an :fou: Il y a peut être des liens dessus, mais en tout cas, je n'en ai pas trouvé...

Lien vers le commentaire
Partager sur d’autres sites

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...