|
Site Web : Pnambique Directeur du Pôle Experts de la société @position http://www.aposition.com Articles de l'auteur : La détection du Link Spam : un challenge pour les moteurs [3/4] La détection du Link Spam : un challenge pour les moteurs [2/4] La détection du Link Spam : un challenge pour les moteurs [Bibl.] La détection du Link Spam : un challenge pour les moteurs [1/4] Cuill veut surpasser Google grâce à l’analyse de données sémantiques 2007 : l’année des moteurs furtifs L’autre sémantique - Le Web Sémantique et les systèmes de recherche d’information. [3.4] L’autre sémantique - Le Web Sémantique et les systèmes de recherche d’information. [3.3] L’autre sémantique - Le Web Sémantique et les systèmes de recherche d’information. [3.2] L’autre sémantique - Le Web Sémantique et les systèmes de recherche d’information. [3.1] Joachim Kreibich (Seekport) : pour nous, un moteur de recherche de qualité doit tenir compte des particularismes linguistiques nationaux, voire régionaux Une tentative de définition du spamdexing Google Base dévoilé ! Les concepts de la POO La programmation objet : qu’est-ce que c’est ? à quoi ça sert ? Gregory Olivier "MSN Search cherche à établir un véritable dialogue avec les webmasters et les référenceurs" Direct Answers from Encarta MSN Search utilise-t’il l’analyse au niveau des blocs ? Spyware : les méthodes pour s’en débarasser Michael James, de la société Mirago "Nous misons sur nos partenaires pour développer notre visibilité" La sémantique appliquée et les outils de recherche [2/6] Linguistique statistique et sémantique appliquée : outil de pertinence pour les moteurs, de KM et de référencement ANALYSE THEMATIQUE (4/4) par le Pr E. Garcia ANALYSE THEMATIQUE (3/4) par le Pr E. Garcia Applications des outils sémantiques au référencement et aux moteurs de recherche Sémantique appliquée : Liens et références bibliographiques ANALYSE THEMATIQUE (2/4) par le Pr E. Garcia ANALYSE THEMATIQUE (1/4) par le Pr E. Garcia CIRCA : la technologie d’Applied Semantics au coeur des Adwords et des Adsense de Google [3] Mon premier programme en PHP (3e Partie) CIRCA : la technologie d’Applied Semantics au coeur des Adwords et des Adsense de Google [2] CIRCA : la technologie d’Applied Semantics au coeur des Adwords et des Adsense de Google [1] Quelques pistes pour comprendre le nouvel algorithme de Google (suite et fin) Quelques pistes pour comprendre le nouvel algorithme de Google FOOXX, le moteur futé venu d’Allemagne Le futur moteur que prépare Microsoft pour MSN sera-t’il Brilliant ? Mooter, un moteur de recherche innovant venu d’Australie Les techniques évoluées d’indexation dans les moteurs de recherche (2e partie) Visibilité et stratégies de développement d’audience sur le Web Les techniques évoluées d’indexation dans les moteurs de recherche L’algorithme HITS et le projet CLEVER (deuxième partie) L’algorithme HITS et le projet CLEVER La structure du web est en forme de "noeud papillon" Webfountain d’IBM Vers un moteur de recherche sensible au contexte (1ère partie) Vers un moteur de recherche sensible au contexte (2ème partie) Vers un moteur de recherche sensible au contexte (3ème partie) Droit d’auteur et site web Droit d’auteur et site web (2e Partie) Droit des producteurs de bases de données (législation française) Tester correctement variables et valeurs en php Mon premier programme en PHP (2e Partie) Les nouveautés de la version 5 de PHP Les origines du PHP Mon premier programme en PHP Pourquoi choisir le PHP pour réaliser des pages dynamiques ? |
Direct Answers from Encarta
[Moteurs de recherche]Direct Answers from EncartaUne nouvelle façon de chercher l’info dans un moteur de recherche20 mars 2005, par CaribooIl s’agit d’un système capable de comprendre certaines questions formulées en langage naturel, et qui délivre en réponse une définition, une date, ou un fait extrait de l’encyclopédie "Encarta" de MSN. Même si cette fonctionnalité est encore limitée, et n’existe que sur la version US du moteur, elle est révélatrice de la direction dans laquelle plusieurs équipes de chercheurs de Microsoft travaillent à l’heure actuelle. Le principe de Direct AnswersDirect Answers from Encarta (réponses directes tirées d’Encarta) est une nouvelle technologie de MSN Search qui est capable de reconnaître si une requête tapée par un internaute correspond éventuellement à un type de questions spécifique, qui peut trouver une réponse factuelle tirée de l’encyclopédie de Microsoft, plutôt qu’une page de résultats classiques. Cette technologie est capable de "comprendre" la syntaxe d’une question, pour savoir quel type d’information est demandée. Le système ne renvoie de réponses que si : 1. Encarta contient effectivement une réponse à la question 2. La probabilité que cette réponse soit la bonne est très élevée Dans les autres cas, c’est une page de résultat classique qui est renvoyée. Dans certains cas, la syntaxe ne suffit pas à résoudre toutes les ambiguités contenues dans une question. Mais le système parvient néanmoins parfois à répondre, grâce à un algorithme particulier qui évalue la probabilité que la requête porte sur un sujet donné plutôt que tel autre. Direct Answers en actionImaginons que j’ai besoin de trouver la date de la mort de Napoléon... Testons le système, et tapons, en langage naturel, la question : "Napolon death". Voila ce que j’obtiens ! :
5 mai 1821, c’est bien ça ... Pas mal. Allons voir maintenant ce que donnent la même requête entrée dans un moteur concurrent. Que me répond Google ? Google me donne une liste de liens, et j’aperçois dans les snippets la date du 5 mai 1821... Mais il faut que je clique sur les pages pour m’assurer qu’il s’agit bien de la date de sa mort, et pas d’autre choses... Maintenant, testons autre chose sur MSN Search : quelle est la hauteur du Mont Blanc ? Je demande "How high is Mont Blanc" Réponse : Answer : Mont Blanc, Europe : elevation, max : 15,782 ft Zut, évidemment, la réponse est en pieds... Qu’à cela ne tienne, demandons combien cela fait en m. Question : "what is 15,782 feet in meters ?" Réponse : Answer : 15782 feet = 4,810.3536 meters Même si ces exemples sont impressionnants, disons tout de suite que Direct Answers ne comprend pas toutes les questions, et ne sait pas trouver toutes les réponses. Mais avec un peu d’habitude, on arrive à trouver très facilement certains faits ou éléments d’information directement. Les types de questions auquel le système sait répondreVoici ci-dessous un tableau résumant le type de questions auquel le système peut parvenir à trouver une réponse. Il faut noter que le système à l’air pour l’instant en phase "expérimentale", on peut s’attendre à quelques améliorations notables dans un futur proche. Les exemples sont en anglais car ce système ne marche - pour le moment - qu’en anglais
Ce tableau n’est pas exhaustif, il ne donne que des exemples de questions que le système peut "comprendre". Par contre, l’expérience prouve que si l’on s’éloigne des schémas des questions décrites ci-dessus, il est inutile d’espérer une réponse. Mais comment ça marche ?Pour comprendre comment un tel système peut fonctionner, on se référera à un de mes précédents articles, dans lesquels je décrivais deux applications expérimentales, qui présentent une certaine parenté (on peut même dire une parenté certaine) avec Direct Answers : AskMSR de l’équipe de Susan Dumais, et "Brilliant" le moteur développé par l’équipe chinoise de MSN avec le concours d’Eric Brill. Pour ceux qui veulent en savoir plus sur la technologie à l’oeuvre ici, on se référera aussi aux articles situés dans la bibliographie de cet article : Le futur moteur que prépare Microsoft pour MSN sera-t’il Brilliant ? Philippe YONNET |
|
|
||
|