Google : Première forme d’intelligence artificielle ?

Croyez-vous en l’intelligence artificielle d’aujourd’hui ?

Pensez-vous qu’un amas de transistors, pourtant capable de rivaliser avec les maîtres aux échecs ou capable d’astiquer sans assistance tous les recoins de votre salon, soit doté d’une quelconque aptitude cognitive assimilable à de l’intelligence ?

Non, ces entités sont incapables de dépasser l’intelligence de leur créateur et leurs pouvoirs d’action se limitent à l’interprétation de signaux et à la résolution d’équations mathématiques.

Une forme nouvelle et artificielle d’intelligence est bien possible mais il y a peu de chance qu’elle dérive de la simple programmation d’un automate autonome. Elle résultera de la contribution de plusieurs intelligences interconnectées.

On parle aujourd’hui d’intelligence collective, celle-ci n’émergerait non pas de la capacité intrinsèque d’un agent mais résulterait de l’interaction avec l’ensemble des agents d’une collectivité.

Ainsi les premières formes d’intelligence artificielles dites distribuées (DAI en anglais) seraient aujourd’hui les applications réseaux (Site Internet dynamiques, Spider, agent de recherche). Un réseau informatique est en effet bien plus qu’un agrégat d’ordinateur,
c’est tout d’abord un ensemble de personnes assisté dans leur communication par des moyens matériels. Chaque composante d’un réseau est un cerveau humain et alors par agrégation, un réseau est un ensemble de sujets intelligents : une intelligence collective.

Une application réseau est capable de s’autogérer et de s’adapter grâce au comportement inconscient (ex : analyse du parcours d’un sujet, des données insérées par celui-ci) ou conscient (interaction avec les sujets par systèmes de vote etc.) de chaque entité constituant ce réseau. Ce genre d’application, se rapprochant de la définition d’être vivant, défini comme l’ensemble des êtres qui se déterminent eux-mêmes (St Thomas d’Aquin), peut donc prétendre à une forme d’intelligence dans la mesure où nous l’entendons.

A l’époque où l’analogie du virus est utilisée de plus en plus souvent pour désigner ces programmes informatiques infestant les ordinateurs d’un réseau, il serait tant de considérer ce réseau comme la forme actuelle la plus développée d’intelligence, la reproduction la plus concrète d’un cerveau, interconnexion de neurones.

L’intelligence nouvelle artificielle sera celle d’un homme fait de tous les hommes qui les vaut tous et que vaut n’importe qui (Sartre), ou ne sera pas.

Google : Oracle d’Internet

Définissons la plus simple expression de l’intelligence collective en considérant une application web, en l’occurrence un moteur de recherche comme google et proposons à cet agent un test d’intelligence élémentaire.

Le principe est le suivant : une liste de mots connus pour avoir une orthographe non triviale est déterminée, les deux orthographes du même mot sont proposées à l’agent, l’une correcte et l’autre fausse. L’agent devra être capable de distinguer parmi ces deux formes quelle est la forme correcte, et ce, sans utiliser de référence (dictionnaire).

Effectuons grâce à Google deux recherches, la première avec l’orthographe correcte du mot, la deuxième avec l’orthographe incorrecte. Pour chacune de ces requêtes, notons puis comparons le nombre de résultats obtenus.

Les résultats sont consignés dans le tableau suivant. Le mot 1 à une orthographe juste, le mot 2 correspond à l’erreur couramment rencontrée. Le résultat 1 (resp. le résultat 2) correspond au nombre de résultats trouvé grâce à Google pour le mot 1 (resp. le mot 2). La colonne rapport affiche le résultat du quotient Résultat 1 sur Résultat2. Si ce rapport est
supérieur à 1, le test est concluant, le moteur a sélectionné la bonne orthographe et d’autant mieux que le rapport est élevé. Si le rapport est inférieur à 1, on considère qu’il y a échec. L’échec étant d’autant plus grand que le rapport est proche de zéro.

Mot 1 Mot 2 Résultat 1 Résultat 2 Rapport
triptyque tryptique 41100 974 42,2
chrestomathie chrestomatie 505 39 12,9
résipiscence récipiscence 2100 33 63,6
soufre souffre 73800 194000 0,4
frisotter frisoter 113 35 3,2
chuchoter chuchotter 8620 221 39,0
linotte linote 6090 134 45,4
joaillier joailler 12300 1240 9,9
annihiler anihiler 13400 640 20,9
pneus pneux 546000 8660 63,0
aplanir applanir 17200 463 37,1
bonhomie bonhommie 8370 864 9,7
chariot charriot 129000 3890 33,2
imbécillité imbécilité 8020 3270 2,5
exubérant exhubérant 9520 512 18,6
catéchisme cathéchisme 44500 1800 24,7
accueil acceuil 9480000 485000 19,5

Analyse effectuée le 10 février 2004 sur www.google.fr (pages francophones)

En parallèle, une enquête a été réalisée sur 53 francophones à Bruxelles entre le 4 et le 6 Février. Chacune des personnes interrogées est confrontée à la liste de mots précédente et doit choisir la forme qui lui semble être l’orthographe juste.
Dans le tableau suivant sont indiqués les résultats obtenus respectivement par Google, le meilleur individu de notre échantillon, la moyenne des individus et le moins bon.

Entité Réponses correctes (17) % Réponses correctes
GOOGLE 16 94 %
MEILLEUR 15 88 %
MOYEN 9,2 54 %
MOINS BON 3 17 %

Enquête effectuée du 9 au 12 février 2004 sur un échantillon de 53 personnes à Bruxelles

Google réalise donc un parcours presque sans faute alors que les individus de l’échantillon font, en moyenne, plus de 50% d’erreur. Il est légitime de se demander si cette performance relève d’une forme d’intelligence ou est assimilable à celle d’un correcteur orthographique classique (tel celui de Word).

- L’agent n’a pas été programmé dans l’intention précise de résoudre ce problème (l’intelligence humaine n’a pas cherché à être artificiellement reproduite)

- L’agent développé est évolutif et son évolution est autogérée : si, par exemple, un nouveau mot français est introduit, celui-ci sera intégré très rapidement sans pour autant qu’il y ait eu une action spécifique pour favoriser son intégration.

Google sait donc lire l’orthographe plus intelligemment que le correcteur de Word même s’il est plus perfectible.

A partir du concept développé ci-dessus, il est possible d’imaginer plusieurs applications possibles en ne considérant plus seulement les mots mais bien plus : les Idées.

Sources :
- Saint Thomas, d’Aquin, Somme théologique, I.P. q18

- Intelligence Collective, P160, Jean Erceau, Jacques Ferber, Edition Hermès 1994

- Sartre, les mots, dernière Phrase du roman

- Google, moteur de recherche, www.google.com