L’algorithme du PageRank expliqué – 2ème partie

La première partie de l’article nous a permis de découvrir la formule du PageRank et quelques exemples concrets de liaisons des pages d’un site.

Continuons notre série d’exemples concrets pour laquelle une calculatrice PageRank pourra vous être utile.

Septième exemple : structure hiérarchique avec lien entrant et lien sortant


GIF - 4 ko
Cases cochées pour l’exemple 7
Le calculateur démontrant un site de 6 pages, les pages
non liées E-F ont un PR de (1-O.85) suivant l’algorithme.

Le simple fait d’émettre un lien vers une page extérieure au départ de la page C fait chuter le PR de manière conséquente sur toutes les pages du site.
Tous les autres liens sont identiques à l’exemple précédent.
Cet exemple en fera méditer plus d’un, nous en sommes certains !
La seule cause de la chute de PR vient du fait que la page C qui redistribuait dans l’exmple 6 tout son PR à la page A, ne lui renvoie plus que la moitié de celui-ci. Que l’autre moitié du PR soir redistribuée à une page interne ou externe ne fait pas de différence s’il n’y a pas de lien en retour.

Mais, en tant que webmaster avisé, nous ferons quelque chose comme…

Huitième exemple : variation du précédent


GIF - 4 ko
Cases cochées pour l’exemple 8

Changeons la page externe en page interne, pour pouvoir s’assurer d’un lien en retour vers la page d’accueil.
Grâce à ce lien, le PR de tout le site est augmenté !

Retenons que l’algorithme du PageRank ne fait aucune différence entre les pages internes et les pages externes.L’avantage des pages internes est surtout dû au meilleur contrôle sur les liens émis, mais un bon échange de lien est toujours souhaitable.

Seules les pages extérieures au site peuvent augmenter le capital PR global. Sans ces liens externes le PR global ne pourrait dépasser le nombre de pages du site.

Neuvième exemple : un plan de site


GIF - 2.4 ko
Cases cochées pour l’exemple 9

Dans cet exemple, la page d’accueil (A) émet un lien vers le plan du site (B). Celui-ci, en plus du lien retour vers la page d’accueil émet un lien vers chacune des pages du site (C, D et E). Pour éviter les « fuites » de PageRank, celles-ci émettent un lien en retour vers la page d’accueil.
La somme des PR de nos pages étant de 5, nous n’avons donc aucune perte dûe à un mauvais chaînage.

Dixième exemple : un plan de site lié différemment


GIF - 2.4 ko
Cases cochées pour l’exemple 10

La seule différence avec l’exemple précédent vient du lien en retour des pages internes du site. Plutôt que d’émettre un lien vers la page d’accueil, elles émettent le lien en retour vers le plan du site (B).
Ceci a pour effet de favoriser le PageRank de notre page B, ce qui peut être souhaité si elle est riche en mots clés.
Par contre, notre page d’accueil voit son PageRank diminuer fortement comme elle n’a plus qu’un lien entrant.
La somme des PR des pages reste à 5 – aux erreurs d’arrondi près – ce qui démontre bien l’absence de perte de PageRank.

Onzième exemple : un plan avec liens entrants sur page interne


GIF - 4.3 ko
Cases cochées pour l’exemple 11

Rêvons un peu…

Le contenu intéressant de la page C lui vaut des liens spontanés de la part de deux sites extérieurs, sans lien en retour.
C’est ce qui va arriver à notre article, non ?

Comme dans les exemples précédents, nous estimerons le PR des pages liantes à 1.0.
La page C voit tout naturellement l’accroissement de PR le plus important (multiplié par 5+), du fait des liens directs. Mais, grâce au chaînage interne, la page d’accueil et le plan du site font toutes deux un bond vers le haut.
Dans une moindre mesure, les pages D et E profitent du gain en PR du plan du site (B).

Question brûlante : Comment accroître son PageRank ?

Nous ne pouvions pas passer sous silence cette interrogation qui nous concerne tous.

Nous avons vu précédemment que, selon la formule utilisée, la moyenne des PageRank des pages du Web
s’établit à 1.0
Chaque page ajoutée à un site fait donc monter de un point et un seul son « capital PageRank » et
un chaînage interne approprié des pages du site aura pour fonction de redistribuer ce capital. Cette accroissement de capital ne sera réalisée que si les nouvelles pages sont liées avec le reste de votre site, et sont de ce fait prises en compte par l’algorithme.
Sans lien extérieur, le « capital PageRank » d’un site ne pourra jamais excéder le nombre de pages.
Il vous reste toujours la possibilité de vous transformer en « Mega-Site », un peu à la mode de
CNN. Ces sites sont régulièrement enrichis de nouvelles pages, créées par une véritable armée de
rédacteurs, toutes pourvues d’au moins un lien vers la page d’accueil. Ces Mega-Sites sont le plus
souvent abonnés au PageRank élevé, en tout cas pour la page d’accueil. Le chaînage interne qui
privilégie celle-ci fait s’effondrer très rapidement le PR des pages internes du site.

Vous n’avez pas d’armée de rédacteurs à disposition ?

Si cela peut vous rassurer, nous non plus !

Une conclusion bien connue de tous les Webmasters s’impose : gagnez des liens en provenance
d’autres sites. Cette chasse aux « backlinks » est, sous certains aspects, la forme moderne de la
« conquête du Graal ».

Comment gagner ces fameux backlinks ?

De plusieurs manières, la plus pratiquée restant l’échange de liens avec des sites amis.
Ce n’est malheureusement pas la plus « rentable », les pages de liens étant souvent chargées d’une multitude de liens, ce qui réduit sensiblement le PR distribué. Souvenons nous de la partie de la formule qui nous intéresse dans ce cas : PR(Tn)/C(Tn), soit le PR de la page divisé par le nombre
de liens sortants.
De plus, les webmasters qui ont compris le fonctionnement de l’algorithme ne feront vraisemblablement pas beaucoup d’efforts pour optimiser le PageRank de leur(s) page(s) de liens… c’est la vie !

La meilleur manière d’obtenir ces fameux backlinks dépendra entièrement de vous. Il vous faudra donner envie à vos visiteurs webmasters d’émettre un lien vers votre site, et seul le contenu de votre site ou d’une page spécifique peut susciter cet élan.
Gardez à l’esprit que « le contenu est Roi », et qu’un contenu riche reste la meilleure manière
d’obtenir des liens spontanés. C’est d’ailleurs un des buts – avoué – poursuivi par cet article.

Après 24 heures de mise en ligne, nous avons observé dans nos logs une diversification des référants, qui sont autant de backlinks supplémentaires. Sur ce plan au moins, nous pouvons dire : « mission accomplie« .

Une dernière manière, non sans intérêt, est de proposer un programme utile en téléchargement gratuit. Un site comme phpBB a droit à un PR8 parce que plusieurs milliers – ou millions – de sites utilisant ce système de forum ont au bas de chaque page un lien vers le site phpBB.com. Cette multitude de liens unidirectionnels contribuent énormément à la notoriété du site phpBB. Mais tout le monde n’a pas forcément les compétences nécessaires à la création d’un tel outil, ce qui limite la portée de cette suggestion.

Les liens sortants perdent du PageRank

Cette affirmation est peut-être un peu brutale et mathématiquement fausse. La formule du PageRank ne fait pas la différence entre un lien interne et un lien externe. Il n’y a donc pas de coëfficient négatif pour ces derniers.

Une chose est certaine toutefois, chaque lien émis distribue une fraction du pouvoir de vote de la page qui l’héberge.
Pour chaque vote émis vers le monde extérieur, c’est donc un petit peu de votre capital qui s’en va… c’est le prix à payer pour ne pas vivre en autarcie.

Pourquoi pas des liens en JavaScript ?

C’est un fait avéré, les moteurs de recherche n’interprètent pas JavaScript, donc ne verront pas ce type de liens et ne distribueront pas le PR.
Il est donc tentant d’émettre tous ses liens sortants en JavaScript, non ? … C’est à notre avis une très mauvaise idée pour les raisons suivantes :
- Cette façon de faire est contraire à « l’esprit du Web » et, reconnaissons-le, assez peu fair-play vis à vis du webmaster du site externe. S’il découvre la supercherie, il y a gros à parier qu’il ne sera pas enclin à vous faire une bonne publicité et qu’il supprimera illico tout lien vers votre site. A vouloir trop gagner… le beurre et l’argent du beurre… on peut aussi tout perdre.
- Les robots Google et l’algorithme détectent très facilement les sites qui n’ont aucun lien sortant, ou ceux dont le déséquilibre est flagrant. Ces sites sont perçus comme des anomalies de l’algorithme et se voient souvent réserver un « sort particulier » – pas toujours au goût du webmaster.
- Les gros annuaires, pensez à Yahoo ou Dmoz, sont des sites à fort PageRank (PR10) bien qu’ils aient énormément de liens sortants. Google crédite un annuaire tel que Yahoo d’environ 700,000 backlinks, alors que Yahoo comporte plusieurs millions de liens sortants et devrait donc se retrouver avec un PageRank très bas… il nous manquerait donc une donnée fondamentale ? Certainement, car ces sites sont…

… « Hub or Authority ? » …

ou

« comment Google perçoit-il votre site ? »

Voilà un sujet tout trouvé pour un prochain article.
A bientôt !


Commentez l’article « Le PageRank expliqué » sur le forum Webmaster-hub