Webmaster Hub - Format normal - Les publications
20 mars 2005
par Cariboo
Les publications de Webmaster Hub
http://www.webmaster-hub.com/publication/Direct-Answers-from-Encarta.html
Il s’agit d’un système capable de comprendre certaines questions formulées en langage naturel, et qui délivre en réponse une définition, une date, ou un fait extrait de l’encyclopédie "Encarta" de MSN.
Même si cette fonctionnalité est encore limitée, et n’existe que sur la version US du moteur, elle est révélatrice de la direction dans laquelle plusieurs équipes de chercheurs de Microsoft travaillent à l’heure actuelle.
Direct Answers from Encarta (réponses directes tirées d’Encarta) est une nouvelle technologie de MSN Search qui est capable de reconnaître si une requête tapée par un internaute correspond éventuellement à un type de questions spécifique, qui peut trouver une réponse factuelle tirée de l’encyclopédie de Microsoft, plutôt qu’une page de résultats classiques.
Cette technologie est capable de "comprendre" la syntaxe d’une question, pour savoir quel type d’information est demandée. Le système ne renvoie de réponses que si :
1. Encarta contient effectivement une réponse à la question 2. La probabilité que cette réponse soit la bonne est très élevée
Dans les autres cas, c’est une page de résultat classique qui est renvoyée.
Dans certains cas, la syntaxe ne suffit pas à résoudre toutes les ambiguités contenues dans une question. Mais le système parvient néanmoins parfois à répondre, grâce à un algorithme particulier qui évalue la probabilité que la requête porte sur un sujet donné plutôt que tel autre.
Imaginons que j’ai besoin de trouver la date de la mort de Napoléon...
Testons le système, et tapons, en langage naturel, la question : "Napolon death".
Voila ce que j’obtiens ! :
5 mai 1821, c’est bien ça ...
Pas mal. Allons voir maintenant ce que donnent la même requête entrée dans un moteur concurrent. Que me répond Google ?
Google me donne une liste de liens, et j’aperçois dans les snippets la date du 5 mai 1821... Mais il faut que je clique sur les pages pour m’assurer qu’il s’agit bien de la date de sa mort, et pas d’autre choses...
Maintenant, testons autre chose sur MSN Search : quelle est la hauteur du Mont Blanc ?
Je demande "How high is Mont Blanc"
Réponse :
Answer : Mont Blanc, Europe : elevation, max : 15,782 ft
Zut, évidemment, la réponse est en pieds... Qu’à cela ne tienne, demandons combien cela fait en m.
Question : "what is 15,782 feet in meters ?"
Réponse :
Answer : 15782 feet = 4,810.3536 meters
Même si ces exemples sont impressionnants, disons tout de suite que Direct Answers ne comprend pas toutes les questions, et ne sait pas trouver toutes les réponses. Mais avec un peu d’habitude, on arrive à trouver très facilement certains faits ou éléments d’information directement.
Voici ci-dessous un tableau résumant le type de questions auquel le système peut parvenir à trouver une réponse. Il faut noter que le système à l’air pour l’instant en phase "expérimentale", on peut s’attendre à quelques améliorations notables dans un futur proche.
Les exemples sont en anglais car ce système ne marche - pour le moment - qu’en anglais
| Types de questions | Exemples de requêtes |
|---|---|
| Définitions, dictionnaire | - define fast - definition of spanakopita - What does emu mean ? |
| Calculs | Calculs mathématiques de base :
· Puissances et racines · Factorielles · Modulo · Pourcentages · Logarithmes (base e et base 10) · Fonctions trigonométriques · Constantes |
| Résolution d’équations | · 2x + 5 = 10 · solve q ^ 2 - 4 = 9 · (2y^2)+(4y-10) = 9 |
| Conversions | · Distances
· Poids · Temps · Volumes · Températures |
| Recherche de faits | · Géographie
· Personnages historiques · Animaux · Questions sur des classements · Questions datées · Questions au sens "deviné" |
Ce tableau n’est pas exhaustif, il ne donne que des exemples de questions que le système peut "comprendre". Par contre, l’expérience prouve que si l’on s’éloigne des schémas des questions décrites ci-dessus, il est inutile d’espérer une réponse.
Pour comprendre comment un tel système peut fonctionner, on se référera à un de mes précédents articles, dans lesquels je décrivais deux applications expérimentales, qui présentent une certaine parenté (on peut même dire une parenté certaine) avec Direct Answers : AskMSR de l’équipe de Susan Dumais, et "Brilliant" le moteur développé par l’équipe chinoise de MSN avec le concours d’Eric Brill.
Pour ceux qui veulent en savoir plus sur la technologie à l’oeuvre ici, on se référera aussi aux articles situés dans la bibliographie de cet article :
Le futur moteur que prépare Microsoft pour MSN sera-t’il Brilliant ?
Philippe YONNET