Aller au contenu

google moteur intelligent : interpretation des abreviations


popov

Sujets conseillés

Je me rend compte que google est vraiment un moteur puissant des les interpretations réalisées des abreviations.

Sur des requète ou sont compris des abréviations type idf bdr etc, j'ai des pages concernant l'ile de france qui ressortent, ou encore les bouches du rhone, alors qu'aucune de ces abréviation ne sont insérées dans mes pages

pareil avec des requètes avec mot clé + 91, c'est mes pages concernant mots clé + essonne qui ressortent

Qui m'explique ?

Modifié par popov
Lien vers le commentaire
Partager sur d’autres sites

Peut-être que quand il voit un acronyme sur la page il le stocke dans sa base pour la page correspondante.

En tout cas c'est sûr que c'est un outil vraiment puissant, qui tend à s'améliorer encore.

Vivement le jour où il saura lire dans les applications Flash :cool:

Lien vers le commentaire
Partager sur d’autres sites

Ho, ne t'inquiètes pas, il sait déjà les lire. Le souci, c'est que la structure même d'un fichier swf, occassionne souvent des ennuis.

Regarde les derniers résultats de cette requête : http://www.google.fr/search?hl=fr&safe...rcher&meta=

Tu constateras que la phrase

Bi Bie Bien Bienv Bienve Bienven Bienvenue Bienvenue s Bienvenue su Bienvenue sur Bienvenue sur l Bienvenue sur le Bienvenue sur le p Bienvenue sur le pr ...

n'est pas pertinente. C'est pourtant comme ça qu'elle est enregistrée dans le fichier. Comme il s'agit d'une animation affichant le texte lettre après lettre, nous ne voyons rien de spécial, en tant qu'humain. Mais un moteur l'interprète comme tu vois très différemment.

Lien vers le commentaire
Partager sur d’autres sites

Il n' y a pas que sur les régions que cela fonctionne mais aussi des mots composés.

Ex : rendez-vous cela donne RDV.

C'est ce que j'avais constaté sur un de mes sites. Je ne l'avais pas sous cette forme dans mon site, mais j'obtenais des visiteurs sous cette requête. J'ai donc optimisé dans ce sens car cela marrangeait au niveau longueur notamment dans le title

Lien vers le commentaire
Partager sur d’autres sites

Qui m'explique ?

La logique ne nous donne que 2 explications possibles :

1- Une armée de Google's guys fait l'inventaire des abbréviations (ainsi que les sigles et symboles numériques utilisés en tant que tels) et dresse une table d'équivalence exploitée dans les classements

2- Des robots analyse le contenu des pages, établissent la fréquence des relations entre des expressions et certaines abbréviations ou symboles, et les considèrent alors comme équivalentes

Ajoutons que :

1- Bien malin qui pourra dire exactement comment ils parviennent à ce résultat

2- Quelle que soit la véritable méthode employée, elle est en tout cas assez efficace, et c'est finalement ce qui compte

Ces évidences posées, nous voilà dans le domaine des conjonctures. En ce qui me concerne, je doute fort que l'armée de Google's guy soit plausible, compte tenu du boulot que ça représenterait avec toutes les langues gérées par Google et la vastitude des domaines dans lesquels ce type d'équivalences existent.

Diverses théories d'analyse sémantique peuvent être des pistes pour expliquer comment Google pourrait établir des équivalences automatiques entre certains termes. A titre d'exemple et suite à l'inventions des "tags" (mots clés) utilisés dans les blogs, de très nombreux chercheurs travaillent actuellement pour essayer de créer des "tags" automatiques, pouvant être affectés à des ensembles de pages. Et d'un certain point de vue, une abbréviation pourrait bien être une sorte de "tag".

Google a plusieurs fois déclaré de façon officielle qu'ils travaillaient sur la sémantique et qu'ils ont déjà mis en oeuvre certaines techniques liées à ce domaine.

Voilà, ça me semble difficile d'aller beaucoup plus loin dans cette réponse à ta question, sans tomber dans un nuage d'hypothèses obscures.

Lien vers le commentaire
Partager sur d’autres sites

exemple promo et intepretté comme promotion, trop fort ;)

Cet exemple n'a rien à voir avec tes premiers exemples (idf, bdr), là il s'agit de stemming (voir les articles de Cariboo dans les publications du Hub ;) ).

Pour idf et bdr je ne serais pas étonné que Google utilise un dictionnaire spécifique pour tout ce qui est lié à la géolocalisation (parce qu'à l'origine de très nombreuses requêtes...).

Lien vers le commentaire
Partager sur d’autres sites

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...