Rechercher dans les publications Rechercher:


Algorithmes, moteurs et techniques d’indexation

Chaque moteur a ses propres recettes pour présenter les résultats de requêtes en fonction de la pertinence des pages.
Cette rubrique traite des algorithmes utilisés à cette fin, des techniques d’indexation et des technologies de recherche en général.

Les articles récents :

Cuill veut surpasser Google grâce à l’analyse de données sémantiques

Le samedi 20 octobre 2007
par Cariboo

Stealth search engines
2007 : l’année des moteurs furtifs

Le dimanche 14 octobre 2007
par Cariboo
Cuill, Radar, Powerset... L’année 2007 apparait comme celle de l’explosion de nouveaux moteurs, promettant un tournant technologique lors de leur sortie courant 2008. Dans beaucoup de cas il s’agit surtout de "promesses marketing" mais il y’a aussi de vrais pionniers qui tentent une approche révolutionnaire.

[une interview exclusive du gérant de Seekport France]
Joachim Kreibich (Seekport) : pour nous, un moteur de recherche de qualité doit tenir compte des particularismes linguistiques nationaux, voire régionaux

Le vendredi 7 avril 2006
par Cariboo

Seekport est un moteur lancé par une société allemande, qui a rapidement créé des versions "localisées" de son outil de recherche dans d’autres pays européens.

A l’heure où l’on parle de plus en plus de projets politiques pour créer un moteur de recherche européen, nous avons questionné Joachim Kreibich, le gérant de Seekport France, pour qu’il nous explique quelle était la stratégie de Seekport et comment il comptait positionner son outil dans ce contexte

Algorithmes
MSN Search utilise-t’il l’analyse au niveau des blocs ?

Le samedi 12 février 2005
par Cariboo
Les chercheurs du centre de Recherche de Microsoft ont publié cet été deux articles sur "l’analyse des liens au niveau des blocs" (block level analysis) : il s’agit d’une amélioration des algorithmes basés sur la popularité des liens, comme le pagerank ou HITS. Nous en dévoilons les principes dans cet article...

Michael James, de la société Mirago "Nous misons sur nos partenaires pour développer notre visibilité"

Le samedi 18 décembre 2004
par Cariboo
Une interview de Michael James, Responsable du Développement Commmercial pour l’Europe de la société Mirago.

Quelques pistes pour comprendre le nouvel algorithme de Google (suite et fin)

Le mardi 20 juillet 2004
par Cariboo

Quelques pistes pour comprendre le nouvel algorithme de Google

Le mardi 20 juillet 2004
par Cariboo

FOOXX, le moteur futé venu d’Allemagne

Le mercredi 16 juin 2004
par Cariboo
FOOXX est un nouveau moteur de recherche, qui utilise les informations récoltées auprès de la communauté de ses utilisateurs pour augmenter la pertinence de ses pages de résultat. Nous avons voulu en savoir plus et nous avons donc décidé de poser quelques questions au "papa" de FOOXX, Peter Krug.

Le futur moteur que prépare Microsoft pour MSN sera-t’il Brilliant ?

Le samedi 12 juin 2004
par Cariboo
Microsoft a annoncé fin 2003 qu’il allait remplacer Inktomi par sa propre technologie de recherche sur MSN. Annoncé d’abord pour le mois de juillet (juste après la date prévue pour l’IPO de Google, coïncidence ?), ce changement interviendra probablement à la rentrée 2004. Mais personne ne sait à quoi va ressembler ce nouveau moteur ... quoique ! On peut s’en faire une idée précise en examinant à la loupe les pistes de recherche explorées par les cerveaux réunis par Microsoft pour son moteur.

Mooter, un moteur de recherche innovant venu d’Australie

Le dimanche 11 avril 2004
par Cariboo
Alors que la guerre fait rage entre Yahoo et Google, et que MSN fourbit ses armes, un petit vent de fraîcheur venu d’Australie est venu démontrer qu’il y’avait encore une place pour des "outsiders".

Deuxième partie : techniques évoluées
Les techniques évoluées d’indexation dans les moteurs de recherche (2e partie)

Le jeudi 25 mars 2004
par Cariboo

Première partie : les méthodes traditionnelles
Les techniques évoluées d’indexation dans les moteurs de recherche

Le jeudi 18 mars 2004
par Cariboo
On parle souvent plus des algorithmes de classement que des robots d’indexation, chargé de récupérer sur la Toile les informations qui serviront à constituer les index des consultés sur les moteurs de recherche. Les robots ou "araignées" (spiders) sont pourtant des éléments clés dans l’architecture d’un moteur. Dans cet article, nous faisons un point sur les différents écueils techniques rencontrés, et sur les dernières solutions trouvées pour les contourner.

Deuxième partie : les applications
L’algorithme HITS et le projet CLEVER (deuxième partie)

Le jeudi 18 mars 2004
par Cariboo
HITS (et ses dérivés) est resté plus longtemps dans les laboratoires que le Pagerank, mais a eu aussi des applications pratiques. Des applications parfois méconnues, mais pourtant intégrées dans des moteurs de recherche grand public comme Ask Jeeves !

Première partie : les principes
L’algorithme HITS et le projet CLEVER

Le mercredi 10 mars 2004
par Cariboo
HITS est, avec le Pagerank, l’un des algorithmes les plus connus. Tous ceux qui s’intéressent au référencement et au monde des moteurs de recherche ont entendu parler des hubs et des authorities. Cet article rappelle les principes de fonctionnement de cet algorithme, et quelles sont ses applications pratiques...

La structure du web est en forme de "noeud papillon"

Le dimanche 28 décembre 2003
par Cariboo
L’équipe d’Andrew Tomkins et de Ravi Kumar a réussi fin 1999 un "coup médiatique" : transformer un résultat scientifique austère en une "image" à la fois originale et parlante. Il faut dire que comparer la structure du Web à un noeud papillon à de quoi surprendre au premier abord... et pourtant !

Webfountain d’IBM

Le dimanche 16 novembre 2003
par Cariboo

Vers un moteur de recherche sensible au contexte (1ère partie)

Le dimanche 2 novembre 2003
par Cariboo
Comment utiliser un algorithme purement mathématique pour obtenir des résultats plus pertinents dans un contexte donné.

Vers un moteur de recherche sensible au contexte (2ème partie)

Le dimanche 2 novembre 2003
par Cariboo
Les différentes pistes explorées par les chercheurs de stanford :
- le pagerank modulaire
- le blockrank
- et le pagerank sensible à la thématique

Vers un moteur de recherche sensible au contexte (3ème partie)

Le dimanche 2 novembre 2003
par Cariboo
Ces travaux vont-ils rester des curiosités de laboratoire, ou vont-ils être utilisés par des moteurs ?
Que cherchait Google, en rachetant Kaltix société créée par les chercheurs qui ont imaginé ces solutions ?
ces solutions sont elles le futur des moteurs de recherche, où sont elles le dernier avatar d’une technologie déjà dépassée ?

[Niveau débutant]
Le PageRank par l’exemple

Le mardi 9 septembre 2003
par Dan
Un outil affichant des valeurs entières ne peut pas représenter l’ensemble des nombres réels positifs, c’est tout le problème de la toolbar Google et de son estimation du PageRank.

Toujours pas sorcier !
L’algorithme du PageRank expliqué - 2ème partie

Le lundi 1er septembre 2003
par Dan
La première partie de l’article nous a permis de découvrir la formule du PageRank et quelques exemples concrets de liaisons des pages d’un site. Continuons notre série d’exemples concrets.

Pas vraiment sorcier !
L’algorithme du PageRank expliqué

Le lundi 1er septembre 2003
par Dan
Quelques centaines - voire quelques milliers - d’interventions sur des forums dédiés au référencement de France ou d’ailleurs m’ont fait réaliser que la notion de PageRank (PR) est parmi celles qui pose le plus de problèmes de compréhension au Webmaster débutant.