Version complète: sur le forum Webmaster Hub : Kaltix
Webmaster Hub > Promotion de Sites Internet > Techniques de Référencement
Nosurf99
Salut à tous,

Pour résumer : l'année dernière Google réchète Kaltix, une société fondée par d'Ex-Googeliens.
Cette boite travaillait sur la "thématisation" du web et la recherche au sein des ces thématiques : on parlait à l'époque de BlockRank ( pour différencier du PageRank).

Google vient de sortir (depuis quand ???) son "Site-Flavored Google Search" : un truc du Google Labs passé en version béta et disponible sur cette page :
http://www.google.com/services/siteflavored.html

Le p'tit clin d'oeil à Kaltix ?
Allez générer votre Google Personnalisé.
Puis un p'tit check dans le code HTML généré :
<img src="http://labs.google.com/images/gp/google_kaltix_site_flavored_searchbox.gif" border=0 alt=Google align=absmiddle>
Voir le nom de l'image wink.gif

Va t'on vers un Google où la popularité d'un site sera calculée au sein d'une thématique et non plus via un simple PR si facile à obtenir (c.f. mangeur de cigogne) ?

Il n'y a qu'un pas à franchir !
Le pas est grand à franchir... mais bon !!!!!!

_AT_bientO
Philippe
Cariboo
Oui, c'est clair que cette fonctionnalité est directement issue des recherches de Kaltix.

Le Hub n'était pas en retard sur ce coup là : voila deux articles rédigés le 2 novembre 2003 dans lesquels je décrivais comment fonctionnait le "topic sensitive pagerank".

Vers un moteur de recherche sensible au contexte (1ère partie)

1ère partie

2eme partie

3ème partie

J'ai relu la conclusion de l'article, et huit mois plus tard, elle prend une actualité certaine :
CITATION
Google a-t’il un projet semblable dans ses cartons ?
Aucune information n’a réellement filtré sur ce sujet pour le moment. Une seule chose est certaine : les chercheurs de Stanford qui ont imaginé les solutions les plus prometteuses travaillent à présent au sein de Kaltix, devenue filiale de Google...

[...]
Ainsi, il semble que Google ait déjà choisi d’utiliser la méthode du "block rank". Ce qui expliquerait la possibilité pour Google d’entrer des nouvelles pages dans son index, tout en leur attribuant une position définitive dans les pages de résultats (ce qui laisse soupçonner un calcul du PR à la volée). La deconnexion clairement apparente depuis deux mois entre les GoogleDance et les calculs de PR plaide également pour un changement de ce genre.

Compte tenu de l’avantage stratégique que donnerait une méthode de recherche sensible au contexte à la firme créée par Page et Brin, il y’a fort à parier que les gens de Kaltix aideront prochainement Google à sortir une innovation de ce genre.

Mais si l’adoption de l’algorithme du blockrank se confirme, cela risque de compliquer les choses. En effet, l’utilisation du blockrank pour créer des pagerank personnalisés n’était encore qu’au stade de l’idée il y’a quelques mois, et on peut supposer que l’application pratique est autrement plus délicate que celle du "Topic sensitive pagerank".

Les difficultés à résoudre sont essentiellement de l’ordre de l’acquisition d’expérience, pour savoir comment déterminer les coefficients donnant les résultats les plus pertinents.

Une googlebarre chargée de communiquer le contexte au moteur ?L’un des principaux écueils à surmonter si l’on veut réaliser un moteur de recherche sensible au contexte performant, c’est la protection des données de l’utilisateur. En effet, si dans certains cas, la requête seule permettra de déterminer la thématique de la recherche, il arrivera fréquemment que celle-ci soit ambigüe. Dans ce cas, la connaissance du contexte doit être étendue, soit aux requêtes précédemment effectuées, voire même aux habitudes de surf de l’internaute

Ces informations n’étant pas anodines, il est dans la pratique difficile d’imaginer d’envoyer au moteur l’historique de surf de l’internaute. Mais nos ex chercheurs de Stanford ont de la ressource : ils ont imaginé de créer une application client capable de faire le travail d’évaluation des thématiques de prédilection de l’internaute en local sur sa machine. Le client de recherche n’aura plus dans ce cas à envoyer au moteur que les éléments sur ces thématiques de prédilection, sans avoir à communiquer d’autres infos plus confidentielles. L’internaute aurait toute possibilité de plus d’accéder et de modifier les caractéristiques de son profil ainsi constitué.

Et si ces techniques étaient déjà dépassées ?
Ces techniques destinées à créer des moteurs de recherche sensibles au contexte semblent constituer l’avenir des moteurs de recherche. Mais elles reposent toutes sur des évolutions de l’algorithme du Pagerank. Et elles ne permettent pas de créer des moteurs réellement intelligents. Il s’agit toujours essentiellemnt de systèmes utilisant la force brute de calcul combinés avec un zeste d’astuce et de savoir faire.
Ceci est une version "bas débit" de notre forum. Pour voir la version complète avec plus d'information, la mise en page et les images, veuillez cliquer ici.