Version complète: sur le forum Webmaster Hub : La baguette magique de Mr Wordpress
Webmaster Hub > Promotion de Sites Internet > Techniques de Référencement
Galdon
Bonjour, afin d'améliorer mon site, j'ai installé Wordpress sur un nom de domaine bidon, et je poste sur ce blog des billets dont le contenu n'a absolument aucun intérêt, si ce n'est de me permettre d'évaluer les performances de Wordress.

CITATION(Le pitch)
J'ai créé un petit script qui enregistre toutes les visites de Googlebot dans un fichier, cela me permet de mesurer les temps qui s'écoulent entre la publication d'un billet et l'exploration de celui-ci par Googlebot.

Les résultats sont hallucinants, en temps normal (pas de mise à jour), Googlebot passe une dizaine de fois sur mon blog (il visite les articles, les tags...). Mais dès que je publie un nouveau billet, il vient explorer mon flux RSS et ma page d'accueil (toujours dans cet ordre, à quelques secondes d'intervalle) dans les 2 minutes qui suivent la publication !

C'est seulement une quinzaine de minutes après la publication de l'article que Googlebot visite la page du billet. C'est après ce délai que je vois mon billet dans les SERP.

Alors forcément ça attise ma convoitise, je voudrais comprendre comment Wordpress arrive à donner de si bons résultats (mon site a bien plus de pages et de trafic, mais ça met parfois 24 heures pour l'indexation des nouvelles pages).

Ce n'est pas par hasard que Googlebot vient explorer mon blog pile au moment ou je publie des articles (comme je l'ai dit, en temps normal GG ne passe que quelques fois par jour), je vois donc deux façons d'expliquer ça :
  • Soit Wordpress est capable de prévenir Google lors des mises à jour (ça serait un peu gros quand même, je privilégie la seconde hypothèse)
  • Googlebot explore mon site bien plus souvent que 10 fois par jour, mais ces requêtes fréquentes ne sont pas loggés dans mon fichier (une sorte de requête légère quoi)

De plus, à chaque fois c'est le flux RSS et la page d'accueil qui sont explorés en premier, j'ai donc regardé dans le <head> de la home et j'y ai trouvé des choses bizarres :

CODE
<link rel="pingback" href="/xmlrpc.php" />
<link rel="EditURI" type="application/rsd+xml" title="RSD" href="/xmlrpc.php?rsd" />
<link rel="wlwmanifest" type="application/wlwmanifest+xml" href="/wp-includes/wlwmanifest.xml" />


Ça pourrait aussi être le <updated>2008-10-08T17:29:14Z</updated> de mon flux ATOM...

Bref je suis dans le brouillard, mais je sens que j'ai mis le doigt sur quelque chose qui vaut le détour...

Merci de m'éclairer
SpeedAirMan
La réponse à ton interrogation : les pings !

Chaque fois que tu publies un article, WordPress envoi un ping à un site pour dire "Hey, coucou, je viens de mettre à jour mon site et y'a une nouvelle page à indexer !".


Plus d'informations (en anglais) : http://codex.wordpress.org/Update_Services
El-Cherubin
Bonsoir,

Est ce que le fait de pinguer propose à google d'indexer le répertoire wp-content aussi?

Car je rencontre ce souci récemment, je me suis lancé pour la première fois dans le blogging (un bien grand mot happy.gif) j'ai écrit un article et depuis a mise en ligne de ce blog, google a tout indexer, meme le répertoire des plugins, ... Je comprends pas trop, j'avais jamais vu ça avant...

http://www.google.fr/search?hl=fr&q=si...rabek.fr%2Fblog

Une explication...?


Merci smile.gif
Dudu
Salut

Moi aussi sur un Wordpress, Google m'a indexé des fichiers de configuration et de fonctions.
Par chance, ils n'apparaissent qu'avec la commande "site:" et pas lors de recherches "normales".

Solution simple: après avoir vérifié qu'aucun lien ne pointait vers ces fichiers (mais comment diable Google les a-t-il trouvé?) j'ai simplement stoppé l'indexation de ces fichiers via robots.txt

(et effectivement, les moteurs aiment beaucoup Wordpress. Je ne m'en plains pas.)
El-Cherubin
Si le robots.txt suffit alors je vais opter pour ça wink.gif
Ceci est une version "bas débit" de notre forum. Pour voir la version complète avec plus d'information, la mise en page et les images, veuillez cliquer ici.