Jump to content

Google indexerait la meta keywords


 Share

Recommended Posts

On vient de me transmettre un article du Journal du Net : Google consulterait-il [...] les Meta keywords ?, dont je trouve les conclusions hâtives.

J'ai retrouvé la source originale dans le cache de Google : Google Uses The Meta Keyword Tag, But Not for What You'd Think.

Je me permets de recopier le contenu du message de Jill Whalen (Fondatrice de High Rankings, un des premières entreprises spécialisées SEO aux US, si j'en crois leur présentation) :

I have an interesting story I wanted to share with you about Google and the Meta keyword tag...

Some months back I realized that the internal search engine that works in conjunction with my content management system (on the main pages of HighRankings.com not the forum) used the Meta keyword tag to show the most relevant pages. Oops, I thought, I guess I probably should have been using the keyword tag on my posts as it would likely improve my site visitors' chances of finding what they were looking for.

So for many of the more recent posts I've made in the newsletter section, if there were words that weren't really being used within the content itself, but were relevant to the article, I'd stick them in the Meta keyword tag (when I remembered).

Here's where the story gets interesting.

The other day I got a Google Alert for High Rankings which looked odd. It was a search result page from my site.

My first thought was...wth? I thought I blocked all search results from appearing in Google.

I don't know if you've noticed, but for the past few years Google puts some pretty weird stuff into search boxes of websites and indexes the resulting pages. And by weird, I mean they'll put single words such as "the" or "bed" or whatever. It can lead to some really silly pages being indexed, which I'm not typically a fan of.

The other problem with search results pages being indexed is that for most sites, their search result template has the same Title tag of something like "Search Results" which when constantly indexed with different words leads to there being thousands of pages of nearly duplicate content. I typically recommend to my clients that they block all search results pages from being indexed, for this very reason.

Turns out that for the High Rankings site, I had in fact blocked the main search results pages, but I had missed the fact that we had a separate search function for forum pages (still within the main pages of the site, not the search function for the forum pages themselves). So that mystery was solved, and it wasn't a case of Google ignoring my robots.txt file.

But when I looked at the weird search result page they had indexed, I saw that the search result was for this search query:

"conversions, rewriting content, 301-redirects, website development, content management"

Huh?

I thought about it a bit as those words somehow seemed familiar to me.

AHA! I remembered that those were the very keywords I had put into the Meta keyword tag of my last posted newsletter article: 3 SEO Traps to Avoid During Your Redesign.

So what does this mean?

For one thing, it helps solve the mystery of where Google gets some of the weird stuff they stick in website's search boxes. It's certainly not the only thing they use, but they obviously use it as one way of making searches. I'm kind of surprised they put the whole string of keywords into the search box though. Why not use the comma separation and put the individual phrases in instead? Seems like that would be more useful. It's possible that they do that as well, of course.

The other interesting thing is that this means that the Meta keyword tag is not completely ignored by Google as most of us have believed. While it's still most definitely ignored in terms of it having any effect on whether your site will show up in a Google search, they do appear to extract the information for other reasons such as this.

Now I have to decide if I should block those forum search pages from being indexed or maybe let it ride so I can see what other interesting queries Google uses and try to figure out where they're getting them from.

Sa version me semble un peu différente de celle postée sur le JDN :

En gros, pour faire des tests, Google tente de valider des formulaires de recherche pour accéder à des pages potentiellement masquées (Web profond, ou web invisible) qui ne seraient accessibles que depuis une requête dans un moteur interne.

Son expérience démontre « seulement » que Google se sert du contenu de ces meta keywords pour remplir ces formulaires (permettant également de vérifier la pertinence de ces keywords), pas pour classer les pages (Ce que prétend pourtant le JDN).

Donc en substance, Google n'utilise pas la meta keywords pour positionner les pages (Et aucun moteur actuel ne le fait : selon ces sites (VO ou VF), seuls Altavista, Inktomi, Lycos et d'autres le faisaient, puis ont progressivement arrêté lorsqu'ils se sont rendus compte que la balise était trop facilement spammable. De tous les moteurs cités, seul Altavista subsiste. Peut-être peut-on lier ces diverses chutes en partie au manque de pertinence induit par la pondération des mots-clés dans les résultats.

Des trois principaux mastodontes, seul Yahoo l'a véritablement utilisée, jusqu'à 2009. Après cette date, sa pondération semble avoir été grandement diminuée, même s'il est toujours possible de positionner une page avec un mot-clé inexistant au préalable (Sorry Yahoo, you DO index the meta keywords tag).

De manière générale, un moteur ne doit pas baser ses résultats de recherche sur des contenus non visibles par l'utilisateur, qui sont beaucoup trop faciles à spammer (meta keywords, meta description …) au risque de se tirer une balle dans le pied. C'est également pour ça qu'ils font tous la chasse aux textes cachés, aux liens invisibles etc. De plus, les algorithmes utilisés maintenant sont parfaitement capables d'extraire les mots-clés importants du contenu du texte.

Par contre, je serai Google (ou tout autre), je me servirai quand même du contenu de la meta keywords pour détecter du spam : si ceux-ci ne correspondent pas au thème de la page, un flag « spam potentiel » pourrait déclencher une vérification manuelle du site pour déterminer s'il y a lieu de lui apposer une pénalité.

Qu'en pensez-vous ?

Link to comment
Share on other sites

Bonjour,

Oui... ça buzze depuis quelques jours...

Lol.... Google a commencé à tester l'indexation des pages accessibles par formulaire dès avril 2008 : http://googlewebmastercentral.blogspot.com/2008/04/crawling-through-html-forms.html

Il ne me paraît pas étonnant qu'à cette fin, il utilise des keywords représentatifs du site ou les métas

Link to comment
Share on other sites

Moi je place toujours la balise meta keywords. Utile ou pas, tous nos sites en sont pourvus.

C'est un reflexe.

Alors, est-ce que cela pénalise nos positionnements, je ne crois pas.

Par contre, effectivement, les sites abusant de cette balise peuvent être sanctionnés.

Link to comment
Share on other sites

Simple détail : je trouve ta suggestion intéressante concernant l'usage que pourraient faire les moteurs des meta keywords pour, justement, déceler les spammeurs. Il est vrai qu'il serais simple de vérifier si le contenu des meta keywords est couramment ou systématiquement différent de mots clés importants extraits du contenu.

Mais ce qui a piqué ma curiosité est dans la suite de la phrase : "un flag « spam potentiel » pourrait déclencher une vérification manuelle".

Est-ce que la vérification manuelle est une réalité chez les moteurs de recherche ??! Ce serais dingue ! : )

Link to comment
Share on other sites

Je ne suis pas dans le secret des moteurs, mais je pense que oui : certains critères sont suffisamment évidents pour activer des pénalités automatiques, mais dans certains cas (sans doute la majorité), une intervention humaine me semble indispensable, pour vérifier si le webmaster du site semble être de bonne foi (Utilisation maladroite de certaines techniques) ou de mauvaise foi (Utilisations voulues dans le but d'améliorer le positionnement).

De plus, des outils comme le spamreport de Google laissent penser que ces vérifications sont entièrement manuelles.

Link to comment
Share on other sites

Il me semble qu'un gros buz a été fait autour d'une simple petite anecdote qui ne prouve, à l'heure actuelle, encore rien du tout. D'ailleurs, l'auteure-même de l'article, Jill Whalen, semble plutôt agacée que cette simple suggesion de sa part ait pu faire un tel buz. Cette réflexion n'a pas été publiée comme article, mais comme simple discussion sur son forum, que je vous invite à lire dans sa totalité : http://www.highrankings.com/forum/index.php?showtopic=45300&st=0

On peut y lire notamment (à propos du remplissage du champ de recherche interne au site) :

BTW, how do you know Google is doing this rather than, say, the forum software, or some oddball human or robotic third party creating strange links which Google then follows?

I suppose I am not 100% sure of it, but all signs so far point to it being Google. Will let you know if I spot anything that would be contrary to that.

Donc déjà, l'auteure n'est même pas sûre à 100 % (et le reconnaît sans problème), que c'est bel et bien Google qui a rempli le formulaire de recherche interne de son site web en utilisant le contenu de la balise Keywords.

La phrase suivante incite elle-aussi à la prudence :

The real question is: Is it repeatable and the results predictable? If you cannot repeat it, then is is just another anomaly. I've seen many strange things with Google's new algorithms.

That's a good point. We'll see if it is in fact repeatable.

Dans tout le reste de la discussion, Jill Whalen répète plusieurs fois, non sans un certain agacement (vu que ses interlocuteurs ne semblent pas bien la comprendre), que la balise meta keywords est totalement ignorée pour le ranking. Elle précise également qu'elle ne l'utilise jamais, à deux exceptions près : son site web (car son moteur de recherche interne l'utilise) et le site d'un certain client pour une autre raison.

La discussion sur son forum se termine même par un beau :

I wish now I hadn't bothered to report this quirky finding of the Meta keywords tag and Google using it for filling out the onsite search. Because any time spent discussing this stupid tag, is time wasted.

And with that, I'm done discussing it, and closing this thread.

Bref, pour ma part, je continue de penser que Google continue d'ignorer purement et simplement cette balise. Je ne crois non plus un seul instant qu'il puisse s'en servir pour éventuellement flaguer un site comme "spam potentiel". D'ailleurs, si c'était le cas, ce serait une raison de plus pour ne pas utiliser cette balise.

Par contre, toujours sur le forum de Jill, un intervenant précise que le W3C recommande d'utiliser et de remplir cette balise. Je ne savais pas et j'aimerais vérifier. Avez-vous des informations là-dessus ?

Link to comment
Share on other sites

Oui, ça semble logique, mais ce sont les conclusions du JDN qui m'ont fait tiquer ;)
Oui... les conclusions sont plutôt hâtives...

(...) meta keywords pour, justement, déceler les spammeurs (...)
Ce méta a fait l'objet a une époque, p.e, de "bourrage" de mots clés : raison pour laquelle, GG ne le prend plus en compte dans le classement d'un site depuis plusieurs années... (d'anciens posts du Hub l'ont plusieurs fois signalés) et par voie de conséquence, certains webmasters n'utilisent plus ce meta...

Lire par exemple : http://www.goopilation.com/2009/09/google-meta-keywords-balise-classement-recherche.html (septembre 2009)...Extrait :

"Q : Pourquoi Google nutilise pas cette balise ?

R : Il y a environ une décennie de cela, les moteurs de recherche ne jugeaient les pages que sur leur contenu, et ne tenaient pas compte des facteurs « externes » comme les liens pointant vers ces pages. A cette époque, la balise meta keywords est rapidement devenue un fourre-tout de mots nayant souvent rien à voir avec le contenu de la page, et les visiteurs ne sen apercevaient jamais. Suite à ces nombreux abus, Google a commencé il y a plusieurs années à ignorer la balise meta keywords."

Ou voir cette vidéo de Matt Cutts (-http://www.youtube.com/watch?v=jK7IPbnmvVU) "Google does not use the keywords meta tag in web ranking " (septembre 2009)

Moi je place toujours la balise meta keywords. (...)
C'est ce que préconise certains mais l'objectif n'est pas les moteurs de recherche majeurs.

(...) Est-ce que la vérification manuelle est une réalité chez les moteurs de recherche ??!(...)
En tout cas, GG a communiqué plusieurs fois sur ce sujet : il y a bien des vérifications manuelles... et parfois même des pénalités manuelles (comme p.e à l'époque où GG a décidé de sévir sur les paidlinks).
Link to comment
Share on other sites

  • 4 weeks later...

Bonjour,

pour en revenir à la prise en compte de la balise title un article paru aujourd'hui sur abondance en apporte un preuve que j'aurai tendance à juger "formelle".

Ce qui a été prouvé est que Google peut utiliser la méta KW pour afficher la pub la plus pertinente possible.

Ceci prouve que Google n'ignore pas cette balise. Le test est d'une simplicité déconcertante et ne laisse aucun doute, pour ce que ca intéresse voici le lien vers l'article.

Qu'en pensez-vous ?

Link to comment
Share on other sites

je suis un peu comme Gorapat...

même si ça ne sert à rien, je place toujours une balise KW, avec juste quelques mots clés, entre 3 et 5, pas plus.

de toute façon, le discours de google est laconique à ce sujet:

d'une part il clame a corps et à cris que KW n'est pas utilisé (pour le référencement),

d'autre part que les meta tags sont examinés, et jouent sur le référencement. (ce que j'ai compris en tout cas avec mon anglais approximatif)

(un site avec de bonnes meta serait plus "sérieux" qu'un autre sans?)

mon intime conviction est que la KW correctement remplie joue un rôle sur la note de crédibilité du site, même si cela n'est pas pris en considération pour le positionnement ni le référencement.

;)

Link to comment
Share on other sites

mon intime conviction est que la KW correctement remplie joue un rôle sur la note de crédibilité du site, même si cela n'est pas pris en considération pour le positionnement ni le référencement.

;)

Sur ce point je relève une contradiction avec laquelle je ne suis pas d'accord. Si la méta KW joue un rôle comme tu le dis sur la note de crédibilité du site (trustrank?) alors elle aurait forcément une influence (même indirecte) sur le positionnement, puisque la crédibilité du site est un facteur important dans le classement.

Perso, je ne sais pas si elle est prise ou non en compte, mais dire qu'elle influence la crédibilité sans influencer le ranking ne serait pas un peu un non sens ?

Link to comment
Share on other sites

Ce résultat n'a rien de surprenant. Google a toujours dit s'inspirer de tout le contenu d'un page pour déterminer les meilleurs annonces à affricher via AdSense.

Donc ce résultat est logique et conforme à ce que dit Google sur le sujet.

Maintenant, mener une telle expérience pour le référencement naturel peut-être très instructif. A suivre donc.

++

Patrick

Link to comment
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
 Share

×
×
  • Create New...