Principe et méthodes de référencement de sites web

Le but de cette page est de présenter les techniques de base du référencement de sites web. Elle permet d’effectuer un tour d’horizon des opérations à effectuer pour préparer les pages en vu du référencement et des démarches à effectuer pour référencer un site.

I) Moteurs de recherche et annuaires

Quand quelqu’un doit rechercher des informations sur Internet, il a recours à des sites spécialisés qui lui permettent d’effectuer cette recherche. Il existe deux types de système de recherche sur Internet : Les moteurs de recherche et les annuaires. Ces deux systèmes sont tout à fait complémentaires pour leurs utilisateurs, mais sont dans le font radicalement différents.

Un moteur de recherche est un système de recherche automatisé, c’est à dire sans aucune intervention humaine. Un « robot » se charge à longueur de journée de parcourir la toile pour visiter des pages et les ajouter dans sa base de données. Le robot, au cours de son parcours, analyse le contenu des pages pour les répertorier et les classer par ordre d’intérêt dans sa base de données. Ce système permet de prendre en compte une grande part du contenu d’Internet, mais le plus gros problème reste la pertinence souvent discutable des résultats obtenus et l’aspect démesuré des données à trier.

Un annuaire, par contre, comporte moins de sites. Ceux ci sont ajoutés « manuellement » par les responsables des différents sites et annuaires. Les annuaires répertorient donc beaucoup moins de pages, mais la qualité des requêtes est souvent meilleure. Les sites sont classés dans les annuaires suivant plusieurs catégories que l’utilisateur peut parcourir rapidement grâce à un système de sélection de catégories et de sous catégories qui permet d’affiner la recherche.

Il existe enfin des méta-moteurs. Ce sont des moteurs de recherche qui génèrent des requêtes sur d’autres moteurs de recherche et rassemblent les réponses qui leur semblent les plus pertinentes. Les méta-moteurs ne possèdent pas de bases de données propres, il est donc impossible de référencer un site dans ce type d’outil de recherche.

II) La préparation des Pages

Cette étape est la phase capitale du référencement d’un site. C’est cette étape qui définit la qualité de référencement des pages par les moteurs de recherche automatisés (tel que Google et Altavista). Elle consiste à préparer la page par l’insertion dans l’en-tête de balises spéciales, qui ne seront pas vues par l’utilisateur, et qui comportent les différentes propriétés de la page. Ces balises sont appelées « balises méta ». Elles comportent deux attributs « name », dont la valeur détermine le type de l’information et « content », dont la valeur correspond à cette information.

Voici les différentes balises qui peuvent être ajoutées à l’en-tête de la page :

  • Description : Contient la description du contenu de la page. Cette description doit contenir mois de 200 caractères. C’est cette description qui sera généralement utilisée comme résumé dans les moteurs de recherche.
  • Keywords : Ce sont les mots clés de la page. Ceux ci sont séparés par des virgules. Ils doivent contenir moins de 1000 caractères.
  • Author : Auteur de la page.
  • Identifier-URL : URL de la page en cours (peut être utilisée par des internautes qui désireraient, après avoir enregistré la page, retrouver la ressource originelle).
  • Reply-To : Courrier électronique du concepteur du site.
  • Revisit-After : Nombre de jours au bout duquel le moteur de recherche doit venir actualiser sa base de données. Il vaut mieux que cette valeur soit supérieure à 30 compte tenu du fait que c’est désormais le délai minimal de réactualisation des plus grands moteurs de recherche. Il faut tout de même avouer que peu de moteurs de recherche en tiennent compte et préfére ce baser sur la notoriété du site pour déterminer la fréquence d’indexation des pages.
  • Publisher : Personne morale ou physique qui publie la page.
  • Copyright : Personne morale ou physique détentrice des droits de reproduction de la page.
  • Generator : Logiciel qui a permis de générer la page.

Il existe d’autres types de balises méta qui permettent de donner des informations au navigateur de l’internaute. Ces balises peuvent tout de même être analysés par les robots. Elles n’ont pas d’attribut « name », celui ci est remplacé par l’attribut « http-equiv ». Sa valeur peut être :

  • Content-Type : type de la page et alphabet qui permet de la lire (utile en France pour spécifier qu’un alphabet accentué est utilisé ou au Japon pour utiliser les caractères spéciaux).
  • Content-Language : langage de la page.
  • Refresh : utilisé pour recharger automatiquement la page de manière périodique.
    Enfin, le dernier paramètre important de la page est son titre, écrit en début d’en-tête entre les balises et . Il doit comporter moins de 100 caractères.

Exemple d’en-tête d’une page (presque choisie au hasard !!!)

Forum Webmaster Hub - La communauté des Webmasters

Remplir les en-têtes n’est pas gage d’un bon référencement. Encore faut-il que ces en-têtes soient judicieusement remplis. Tous les moteurs de recherche ont leurs propres critères d’évaluation de la pertinence d’une page. Mais le respect de quelques règles devrait permettre d’assurer un référencement assez large du site.

Ainsi, les principaux mots clefs doivent se retrouver dans la description et dans le titre des pages. Ils doivent aussi se retrouver une ou plusieurs fois dans le corps de la page. Les mots clef doivent faire moins de 1000 caractères, ce qui représente déjà un nombre assez conséquent. Cependant, certains sites spécialisés conseillent de se limiter à 15 à 20 mots clefs. En effet, moins il y a de mots clef, plus ils ont, pour certains moteur de recherche, une grande importance. A l’inverse, la multiplication des mots clefs limite leur poids. Pour résumer, un mot clef aura d’autant plus de poids qu’il sera en début de liste, répété plusieurs fois dans la page, et que les mots clefs sont peut nombreux.

De plus, il faut veiller à mettre des mots clef qui sortent de l’ordinaire. Par exemple, le mot clef  » Internet  » est bien, mais trop répandu pour qu’il ait la moindre chance de propulser un site en tête d’une requête. De même pour le titre de la page, évitez les formules du type « bienvenu sur… » trop banal, sans intérêt pour l’Internaute et inefficace pour le référencement. Il faut veiller également à varier les différents attributs. Deux pages qui n’ont pas strictement le même contenu ne doivent pas avoir le même titre, ni les mêmes mots clefs, ni la même description. Ainsi, le moteur de recherche considérera que le site est d’autant plus riche que son contenu est varié. De plus, une description et des mots clefs ne sauraient s’adapter parfaitement à toutes les pages d’un site.

Il ne faut pas non plus négliger la valeur de l’attribut « alt » des balises « img ». Cet attribut permet d’insérer un commentaire qui sera affiché à la place de l’image lorsque celle-ci ne peut être chargée. Ces attributs « alt » sont utilisés par la plupart des moteurs de recherche pour répertorier les images contenues dans les pages web. Ainsi, pour la présentation d’une photo de la comète de Halley, le commentaire « comète de Halley » sera plus pertinent que le commentaire « photo 1 » ou pas de commentaire du tout.

III) Le référencement du site.

Une fois que les pages ont été réalisées et mises en ligne, il faut référencer le site. Pour cela, deux solutions : soit référencer les sites en visitant chaque moteur de recherche, soit utiliser un site ou un logiciel qui permet de référencer automatiquement le site dans les principaux moteurs de recherche.

Le référencement moteur de recherche par moteur de recherche est beaucoup plus efficace que le référencement automatique. Cependant, il peut être intéressant d’effectuer au moins un référencement automatique afin d’être référencé dans les moteurs de recherches les moins connus. Vous trouverez quelques sites listant les principaux annuaires et moteurs de recherche ainsi que l’adresses des pages de soumissions associées (qui ne sont pas toujours des plus évidentes à trouver). A ce propos, le site http://www.enfin.com est un méta-moteur qui vous indique, pour chaque recherche que vous faites, la liste des sites qui sont spécialisés dans ce type de recherche. Grace à ce site, vous avez de grandes chances de trouver les moteurs de recherches dans lesquels vous gagnerez à être référencé.

Quand une URL est soumise à un moteur de recherche, l’URL est ajoutée à la liste des pages à visiter. Le moteur de recherche va ensuite suivre l’ensemble des liens à partir de l’URL soumise. Ainsi, pour référencer un site, il est inutile de référencer toutes les pages. Seule la première page est à référencer. Il faut d’ailleurs noter que certains moteurs de recherche pénalisent les soumissions multiples de pages de sites.

Si le site à référencer se présente sous la forme de frame, il est fortement recommandé de référencer la page principale plutôt que la frame en elle même. En effet, certains moteurs de recherches ne prennent en compte que la partie « noframe » de telles pages web.

Pour référencer une page, il est préférable de soumettre l’adresse complete de la page. Ainsi, plutot que de soumettre « http://www.exemple.com/« , il vaut mieux référencer « http://www.exemple.com/index.html« .

Quand une des pages du site est référencée dans un moteur de recherche, il est inutile de référencer à nouveau le site lorsqu’il a subit un changement. En effet, les moteurs de recherche mettent régulièrement à jour leur base de données, la période de mise à jour correspond d’ailleurs à peu prés au temps de prise en compte d’une page soumise.

Pour le référencement dans les annuaires, il faut préparer au préalable une description du site ainsi qu’une liste de mots clefs. Une adresse électronique valide peut également être demandée. Il faut noter que les annuaires étants normalement mis à jours par des personnes physiques, le temps avant que votre site ne soit testé et ajouté à la base peut être relativement long. Les annuaires peuvent également refuser votre site parcequ’ils jugent que votre site ne correspond pas à leur attentes, tant sur le plan qualitatif que sur la nature du contenu.

IV) Les astuces et autres petites magouilles

La règle d’or sur Internet est de ne pas tricher pour être mieux référencé. En effet, si les moteurs de recherche peuvent se laisser tromper par les nombreuses astuces de référencement, les moteurs de recherche évolués, eux, repèrent vite les tricheurs et ne référencent pas leurs pages. Donc, a moins de ne vouloir être référencé que dans des moteurs de recherche marginaux, il vaut mieux ne pas utiliser de stratégies visant à tromper les moteurs de recherche sur le contenu réel d’un site.

De plus, si le contenu d’un site n’est pas à la hauteur de ce qu’il prétend contenir, cela va agacer le visiteur, qui ne restera pas sur le site. Quand un internaute utilise un moteur de recherche c’est que généralement il a une idée précise de ce qu’il espère obtenir ; il ne sert à rien de vouloir le forcer à visiter des sites qui n’ont pas de lien direct avec ce qu’il cherche.

Enfin, une astuce, qui marche cette fois, et de créer une communauté de sites. Le principe est de mettre un lien vers d’autres sites qui, en échange, mettent un lien vers le site. Ceci s’appel faire des échanges de liens. Ainsi, quand un moteur de recherches va visiter l’un des sites de la communauté, il va, par la même occasion, et en suivant les liens, visiter et référencer les autres sites. De plus, certains moteurs de recherche évaluent la popularité d’un site au nombre de liens qui pointent vers lui.

Cette dernière technique fonctionne relativement bien avec des moteurs de recherches de type « Google » qui évaluent la popularité d’un site en comptant le nombre de sites qui pointe vers lui. Cependant, des sites appelés « Farm Link » (ou ferme de liens) sont apparus. Ces sites comportent des pages sans contenu et qui n’ont pas d’autre interet que de pointer sur d’autres pages web. On ne pourra jamais vous reprocher de figurer dans ce type de pages, mais certains moteurs de recherches auront tôt fait de vous supprimer de leurs bases si vous mettez en place des liens vers ce type de site.

V) Conclusion

Ces quelques pages auront permis de présenter les méthodes de bases du référencement de sites web. Elles constituent une approche simple, mais déjà assez complète, des premiers aspects du référencement. Le respect des principes décrits ci dessus doit permettre un référencement correct des sites.


Commentez l’article « Principes et Méthodes de référencement de sites web » sur le forum Webmaster-hub