Le PageRank par l’exemple

Le PageRank est l’idée que Google se fait de la popularité d’une page web. Il part d’une idée simple : au plus une page web a de liens pointant vers elle, au plus elle doit être populaire ou importante.
Cette « importance » de la page est présentée aux internautes sous forme d’une petite barre verte s’affichant dans la barre d’outil Google, sur une échelle de 1 à 10.

Mais un outil affichant des valeurs entières ne peut pas représenter l’ensemble des nombres réels positifs, c’est tout le problème de la toolbar Google et de son estimation du PageRank.
L’erreur généralisée vient de ces représentations simplistes du PR sur une échelle de 0 à 10.

Il est généralement admis que l’échelle de 0 à 10 représentée par la toolbar est une échelle logarithmique dont on estime la base entre 5 et 8. Ce qui veut dire qu’un PR(n) correspondrait en réalité à un PR(n-1) multiplié par un facteur compris entre 5 et 8…

[(La suite de cet article est à prendre avec une « pincée de sel » comme il n’est pas « mathématiquement exact ». L’algorithme du Pagerank a délibérément été simplifié à l’extrême pour que cet article soit compréhensible par le plus grand nombre. Le principe expliqué est néanmoins une bonne approximation de la réalité)]

Procédons par l’exemple pour mieux comprendre ce qu’affiche en réalité la toolbar.
Considérons pour la suite de cet article qu’un vote correspond à un lien entrant.

En prenant une échelle logarithmique en base 5 et imaginant qu’il suffit d’un « vote » pour obtenir un PR1, il faudrait donc :

Echelle en base 5
1 vote pour un PR1
5 votes pour un PR2
25 votes pour un PR3
125 votes pour un PR4
625 votes pour un PR5
3125 votes pour un PR6
15625 votes pour un PR7
78125 votes pour un PR8
390625 votes pour un PR9
1953125 votes pour un PR10

Jusque là, rien de très complexe, on multiplie chaque niveau par la valeur de la base (5).
Les chiffres diffèrent bien sûr pour les bases 6, 7, 8 etc… mais restons à notre base 5 pour la suite de l’explication.

La valeur du « vote » correspondant à un backlink dépend à son tour du PageRank de la page qui émet le lien… donc un calcul du PageRank de toutes les pages demande un nombre d’itérations élevé pour converger.
[(Pour connaître le PageRank d’une page A, il faut connaître le PageRank de toutes les pages qui pointent vers cette page, et ainsi de suite.)]

Il est facile d’imaginer qu’un « vote » provenant de la page d’accueil de Microsoft vaut bien plus qu’un vote provenant d’un site perso inconnu de presque tous.

Un exemple concret

Prenons une page de PR7 affiché, ayant selon notre exemple un potentiel de « vote » au moins égal à 15625.

Selon l’algorithme du PageRank, une page peut redistribuer du PR à hauteur de 85% de son PR propre, soit dans ce cas 13281.25

Si cette page émet 6 votes, chacune des pages liées recevra 1/6 de cette valeur, soit 2213, ou encore suffisament de « votes » pour obtenir un pr5 avec un seul backlink.
Si cette page émet 100 votes, la quantité transférée pour chaque page liée n’est plus que de 132, juste assez pour un « petit » pr4.

Mais en suivant notre échelle en base 5, une page à PR7 affiché représente un pouvoir de vote compris entre 15625 et 78124 votes.
Dans l’exemple qui précède, on a imaginé que la page initiale à PR7 affiché avait un pouvoir de vote « au plancher » (15625) mais il pourrait être bien plus haut, par exemple 60000. C’est ce qu’on pourrait appeller un PR7 « fort ».

Soit 60000*0.85 = 51000 « votes » à redistribuer.

Si la page émet 3 votes, cela représente un capital de 17000 pour chacune des pages liées , donc chacune de ces pagee hérite de suffisamment de « votes » pour obtenir à son tour un PR7. Cela commence devenir intéressant, non ?

On peut rêver… ou agir !

Certains sites à fort PR, tels que le site de Macromedia, n’hésitent pas à mettre à la une des sites bien moins connus, pour autant que ces derniers proposent des contributions prisées.
Un développeur d’applications qui propose au téléchargement une extension pour Dreamweaver ou Flash, se verra cité comme développeur du mois à la une du site Macromedia, ou en tout cas sur une page à fort PR. Selon la page où le lien est émis, le site lié peut très bien se retrouver avec un PR8.

Il en va de même pour les développeurs Apache ou les contributeurs du W3C, qui ont des liens vers leurs sites au départ de pages à PR8 ou PR9… de quoi faire les choux gras de nombre d’entre-nous.

Pour résumer

Vous voulez un PR élevé ? Mettez en libre téléchargement un outil original prisé par la communauté Internet (et prévoyez de la bande passante).
Si vous n’êtes pas développeur d’applications, peut-être êtes vous auteur ? En rédigeant des articles intéressants vous atteindrez les mêmes objectifs.
Chaque site émettant un lien vers votre page de téléchargement ou votre article contribuera à vous propulser au « paradis des PR élevés »


Une question sur l’article ? Quelque chose ne vous semble pas clair ? Commentez l’article « Le PageRank pour les Nuls » sur le forum Webmaster-hub