|
Site Web : Webmaster Hub Ingénieur de formation, j’ai depuis longtemps été attiré par l’informatique et le système d’exploitation Unix en particulier (premier système perso sous Unix fin 1978) Après plus de 20 ans d’administration de systèmes Unix en tant que freelance au 4 coins de la planète, j’ai eu envie de faire autre chose et de poser mes valises en 2002. L’étude du Php est simple lorsqu’on a "parlé couramment" le langage C pendant si longtemps. J’ai donc créé mes premiers sites dynamiques, en partant de la feuille blanche. Ensuite, le besoin de découvrir le monde du référencement m’a attiré vers les forums spécialisés, sur lesquels j’ai eu l’occasion d’enrichir mes connaissances sur le sujet, et y découvrir les plaisirs de la modération. L’envie de démarrer un forum dédié aux Webmasters, ratissant plus large que le domaine du référencement, a germé lentement dès cette époque et a donné la naissance du Hub le 18 août 2003. Articles de l'auteur : Le PageRank par l’exemple L’algorithme du PageRank expliqué - 2ème partie L’algorithme du PageRank expliqué La réécriture d’URL récursive Le Round-Robin DNS de Google Mod_rewrite, ou la réécriture des URL "à la volée" Le fichier .htaccess |
Le PageRank par l’exemple
[Niveau débutant]Le PageRank par l’exempleL’inexactitude de la toolbar Google9 septembre 2003, par DanLe PageRank est l’idée que Google se fait de la popularité d’une page web. Il part d’une idée simple : au plus une page web a de liens pointant vers elle, au plus elle doit être populaire ou importante.
Mais un outil affichant des valeurs entières ne peut pas représenter l’ensemble des nombres réels positifs, c’est tout le problème de la toolbar Google et de son estimation du PageRank.
Il est généralement admis que l’échelle de 0 à 10 représentée par la toolbar est une échelle logarithmique dont on estime la base entre 5 et 8. Ce qui veut dire qu’un PR(n) correspondrait en réalité à un PR(n-1) multiplié par un facteur compris entre 5 et 8... [(La suite de cet article est à prendre avec une "pincée de sel" comme il n’est pas "mathématiquement exact". L’algorithme du Pagerank a délibérément été simplifié à l’extrême pour que cet article soit compréhensible par le plus grand nombre. Le principe expliqué est néanmoins une bonne approximation de la réalité)] Procédons par l’exemple pour mieux comprendre ce qu’affiche en réalité la toolbar.
En prenant une échelle logarithmique en base 5 et imaginant qu’il suffit d’un "vote" pour obtenir un PR1, il faudrait donc :
Jusque là, rien de très complexe, on multiplie chaque niveau par la valeur de la base (5).
La valeur du "vote" correspondant à un backlink dépend à son tour du PageRank de la page qui émet le lien... donc un calcul du PageRank de toutes les pages demande un nombre d’itérations élevé pour converger. [(Pour connaître le PageRank d’une page A, il faut connaître le PageRank de toutes les pages qui pointent vers cette page, et ainsi de suite.)] Il est facile d’imaginer qu’un "vote" provenant de la page d’accueil de Microsoft vaut bien plus qu’un vote provenant d’un site perso inconnu de presque tous. Un exemple concretPrenons une page de PR7 affiché, ayant selon notre exemple un potentiel de "vote" au moins égal à 15625. Selon l’algorithme du PageRank, une page peut redistribuer du PR à hauteur de 85% de son PR propre, soit dans ce cas 13281.25 Si cette page émet 6 votes, chacune des pages liées recevra 1/6 de cette valeur, soit 2213, ou encore suffisament de "votes" pour obtenir un pr5 avec un seul backlink.
Mais en suivant notre échelle en base 5, une page à PR7 affiché représente un pouvoir de vote compris entre 15625 et 78124 votes.
Soit 60000*0.85 = 51000 "votes" à redistribuer. Si la page émet 3 votes, cela représente un capital de 17000 pour chacune des pages liées , donc chacune de ces pagee hérite de suffisamment de "votes" pour obtenir à son tour un PR7. Cela commence devenir intéressant, non ?
On peut rêver... ou agir !Certains sites à fort PR, tels que le site de Macromedia, n’hésitent pas à mettre à la une des sites bien moins connus, pour autant que ces derniers proposent des contributions prisées.
Il en va de même pour les développeurs Apache ou les contributeurs du W3C, qui ont des liens vers leurs sites au départ de pages à PR8 ou PR9... de quoi faire les choux gras de nombre d’entre-nous. Pour résumerVous voulez un PR élevé ? Mettez en libre téléchargement un outil original prisé par la communauté Internet (et prévoyez de la bande passante).
|
|
||
|