Ces centres comprennent chacun plusieurs milliers de PC en réseau... une très grosse structure car sans avoir de données précises, on estime le nombre d'ordinateurs utilisés pas Google à 50 000 ... de quoi chauffer une petite ville.
Lorsqu'on interroge google.com ou n'importe quelle version locale de l'index comme google.fr, la requête est redirigée vers l'un de ces centres en fonction de la situation géographique de l'internaute et de la charge du réseau.
Un article du Hub explique ce mécanisme nommé Round Robin: Le Round Robin DNS
De par le passé, Google faisait des mises à jours mensuelles de ses index, et vu le nombre d'ordinateurs impactés ne pouvait pas le faire instantanément.
Il commençait donc avec tous les ordinateurs d'un DataCentre (au hasard) et une fois l'index à jour, le propageait vers les autres, en séquence.
Cette propagation prenait un peu moins d'une semaine et pendant cette semaine, en fonction du DataCentre vers lequel les recherches étaient redirigées par le Round-Robin ("index à jour" ou "index ancien"), les résultats pouvaient varier à intervalle de quelques minutes. On disait alors que "Google dansait", vu l'instabilité apparente de ses résultats.
Cette expression est restée sous le nom de "Google Dance". (avec un C en anglais)
Depuis peu, Google fait une mise à jour de ses index quasiment "en continu" ce qui a créé pas mal de remous chez les webmasters ces derniers mois.
L'avantage de cette approche est qu'un nouveau site peut se trouver dans l'index bien plus vite qu'avant... l'inconvénient est qu'il reste toujours une partie assez lourde de recalcul de "l'importance des pages" (le PageRank) que Google doit effectuer à intervalle régulier.
Il semble que la période s'établisse autout de 15 jours, et on appelle cela une "mini Google Dance" car le positionnement varie moins qu'avant comme tous les index sont à peu près synchronisés en continu.
Cette phase de calcul est principalement utilisée pour calculer la "popularité" (l'importance selon Google) d'un site, en se basant sur l'algorithme du PageRank.
En quelques mots: il faut que pour chaque page de l'index (près de 4 milliards), Google calcule le nombre de pages émettant un "vote" (un lien) vers celle-ci. Le résultat donnera une idée de la popularité de la page, qui est un des critères servant à classer les résultats de recherche. Mais là c'est une autre histoire...
Quelques articles sur le Hub expliquent le "PageRank" nous conseillons à ceux qui ne sont pas familiers avec cette notion de commencer par le premier de la série: Le PageRank par l'exemple, c'est le plus "digeste".

Connexion
Inscription
Aide




Haut
Citer





