Aller au contenu

Google : un vocabulaire contrôlé ?


Stephan

Sujets conseillés

Bonjour à tous !

Je m'interroge sur un comportement de Google que j'observe sur mes pages.

Étant donnée la nature de l'exemple, ce post sera périmé dès janvier 2005 !

Mise en situation :

Je crée une page h ttp://www2.csduroy.qc.ca/mdc/index.html

Je lui donne un titre <title>Maîtrise du Cap - Accueil</title>

Puis un header correspondant <h2><span>accueil</span></h2>

Pour chaque entrée, je code un titre-lien :

<h3 id="messedeminuit"><a title="Lien permanent vers cette entrée" href="~mdc200412.html#messedeminuit">Messe de minuit</a></h3>

Je copie et renomme la page h ttp://www2.csduroy.qc.ca/mdc/~mdc200412.html

Je modifie le titre <title>Maîtrise du Cap - Archives</title>

Je modifie le header <h2><span>archives</span></h2>

Et c'est tout ! (Il y a un fil RSS, mais je ne crois pas que ce soit important).

Je "upload" les deux pages sur le serveur.

Un vocabulaire contrôlé ?

Je recherche maitrise messe sur Google.

Surprise ! Google me présente la page Maîtrise du Cap - Archives !

Et ce n'est pas un cas isolé.

Rechercher maitrise minuit

Rechercher maitrise baroque

Rechercher maitrise allemagne

Rechercher noel baroque en allemagne

Sachant que les seules différences entre les deux pages sont :

Le nom : index.html => ~mdc200412.html

Le titre : Maîtrise du Cap - Accueil => Maîtrise du Cap - Archives

Le header : accueil => archives

Sachant également que les deux pages ont été publiées au même moment et que pour être indexée, ~mdc200412.html doit obligatoirement passer par index.html, j'en viens à la conclusion que Google privilégie le mot "archives".

Des explications ?

Merci à l'avance !

Modifié par Stephan
Lien vers le commentaire
Partager sur d’autres sites

Salut,

Je pense que ça vient de ton ancre et du lien.

Vu que sur les deux pages identiques, le lien (dont le texte est "Messe de minuit") pointe vers "~mdc200412.html", Google juge que cette page est plus pertinente pour ces mots-clé que la page "index.html".

a mon avis, si le lien pointait vers la page "index.html", celle-ci aurait été privilégiée.

Je ne suis pas sûr de m'être exprimé très clairement, ni que c'est la bonne explication, mais je pense que ça vient de là...

A+ Stephan.

Lien vers le commentaire
Partager sur d’autres sites

Merci Eclipsis !

C'est peut-être un début d'explication.

a mon avis, si le lien pointait vers la page "index.html", celle-ci aurait été privilégiée.

Si le lien ne pointait pas vers "~mdc200412.html", Google aurait tout simplement ignoré cette page puisqu'il faut au minimum un lien vers une page pour que celle-ci soit indexée. C'est donc certain que la page "index.html", aurait été privilégiée. Pas de lien, pas d'indexation (enfin, il me semble).

À moins que tu ne fasses allusion au lien de la page "~mdc200412.html" qui pointe vers lui-même. Dans ce cas, il serait intéressant de le supprimer lors de mon prochain billet et observer le comportement de Google à ce moment.

J'ai pourtant observé un autre site utilisant le même procédé d'archivage (à l'exception que pour celui-ci, seul l'URL est changé, le reste demeure intact) et mes requêtes me conduisent toutes sur la page d'accueil (du moins pour les entrées récentes).

à suivre...

Modifié par Stephan
Lien vers le commentaire
Partager sur d’autres sites

Mise à jour du sujet

Cette fois, par curiosité j'ai procédé comme suit :

J'ai créé ma page h ttp://www2.csduroy.qc.ca/mdc/index.html

Je lui ai donné un titre <title>Maîtrise du Cap - Accueil</title>

Puis un header correspondant <h2><span>accueil</span></h2>

J'ai codé le titre-lien :

<h3 id="bonneannee"><a title="Lien permanent vers cette entrée" href="~mdc200501.html#bonneannee">Bonne année!</a></h3>

J'ai copié et renommé la page h ttp://www2.csduroy.qc.ca/mdc/~mdc200501.html[/#]

J'ai modifié le titre <title>Maîtrise du Cap - Archives</title>

J'ai modifié le header <h2><span>archives</span></h2>

Plus : j'ai remplacé le lien qui pointait vers lui-même (voir premier post) par un lien de type "#".

<h3 id="bonneannee"><a title="Lien permanent vers cette entrée" href="#">Bonne année!</a></h3>

Donc maintenant, si je recherche maitrise bonne annee sur Google, la requête renvoie Maîtrise du Cap - Accueil.

Ça serait donc une question d'URL.

Lien vers le commentaire
Partager sur d’autres sites

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...