Cariboo Posted October 20, 2007 Share Posted October 20, 2007 Je viens (chose promise chose due) de publier l'article que j'avais annoncé la semaine dernière sur Cuill, un moteur présenté souvent comme LE Google killer. (??) Cuill veut surpasser Google grâce à l'analyse de données sémantiques Il y'a déjà un buzz énorme autour de ce moteur (ce qui pourrait d'ailleurs être une bonne raison de ce méfier, tant ce type de buzz aboutit souvent à des choses qui font pschittt! à la fin, pour reprendre l'expression d'un ex-Président). Beaucoup d'articles ont déjà été écrits sur le sujet, y compris sur les blogs et sites francophones. Je n'aurais sans doute pas écrit une ligne sur ce sujet si le hasard n'avait pas voulu que je m'intéresse de près à deux de ses fondateurs depuis longtemps : Tom Costello, qui a travaillé sur Webfountain (voir l'article que j'avais rédigé sur le projet à l'époque Webfountain d'IBM ), et Anna Paterson. J'ai donc voulu notamment partager avec vous des informations sur les technologies que maîtrisaient ce couple de spécialistes de l'IR, technologies que l'on retrouvera peut-être dans ce nouveau moteur. Tant pis si ce moteur ne sort jamais du mode furtif, des gens comme eux font bouger le monde des moteurs de recherche et démontrent que l'on peut encore innover dans ce domaine. On notera au passage qu'Anna Paterson est beaucoup plus bavarde sur TeraGoogle depuis qu'elle a quitté son bureau de Mountain View. Link to comment Share on other sites More sharing options...
petit-ourson Posted October 20, 2007 Share Posted October 20, 2007 Merci Philippe pour cet article. Link to comment Share on other sites More sharing options...
KaRaK Posted October 20, 2007 Share Posted October 20, 2007 Google sest ému de lactivité de ses ex-googlers et a déjà proposé de les racheter. Tu m'étonnes Merci pour cet article. Link to comment Share on other sites More sharing options...
captain_torche Posted October 20, 2007 Share Posted October 20, 2007 J'ai été captivé ! Merci pour l'article Link to comment Share on other sites More sharing options...
Théo B. Posted October 21, 2007 Share Posted October 21, 2007 Intéressant Link to comment Share on other sites More sharing options...
Dan Posted October 21, 2007 Share Posted October 21, 2007 J'ai d'ailleurs rajouté le User_Agent de Cuill dans la liste des moteurs à reconnaître... et on le voit sur le Hub ! Link to comment Share on other sites More sharing options...
TheRec Posted October 21, 2007 Share Posted October 21, 2007 Très bon article, merci beaucoup Cariboo ! Link to comment Share on other sites More sharing options...
rperruez Posted October 21, 2007 Share Posted October 21, 2007 Bonjour, Récemment en lisant un des interwiew de Arlette la question etait posé de savoir si la toute puissance de Google dans la main mise sur l'information serait concurrencé un jour...(je vais retrouver le lien) L'article me donne un début de réponse ! merci monsieur Cariboo ! Une petite question de l'angoissé que je suis :-)) >la liste des brevets déposés par Anna Paterson depuis quelle travaille chez Google. Les brevets lui appartiennent ? (je préfèrerais ;-) richard Link to comment Share on other sites More sharing options...
Loctus Posted October 21, 2007 Share Posted October 21, 2007 En effet très interessant ! Merci pour l'article Cariboo Link to comment Share on other sites More sharing options...
michaeljack Posted October 21, 2007 Share Posted October 21, 2007 Je rêve ou ce moteur n'est pas encore en ligne? Je trouve çà présomptueux de déjà parler de Google Killer. Merci en tout cas pour l'article que je vais lire de suite Link to comment Share on other sites More sharing options...
Cariboo Posted October 21, 2007 Author Share Posted October 21, 2007 Oui Michaeljack, le moteur est "furtif", il n'est pas disponible pour le grand public. Notez bien que ce sont les autres qui parlent de Google killer, pas les gens de Cuill. =>la plupart des brevets cités par l'article sont déposés par Anna Paterson au nom de Google. Je suis persuadé que d'autres vont apparaître bientôt déposés pour le compte de Cuill. Tiens Twiceler est toujours sur le Hub... Bon, je crois qu'on va être rapidement repérés, Link to comment Share on other sites More sharing options...
rperruez Posted October 21, 2007 Share Posted October 21, 2007 =>la plupart des brevets cités par l'article sont déposés par Anna Paterson au nom de Google. Je suis persuadé que d'autres vont apparaître bientôt déposés pour le compte de Cuill. Merci pour cette rapide réponse ! richard Link to comment Share on other sites More sharing options...
petit-ourson Posted October 21, 2007 Share Posted October 21, 2007 J'ai d'ailleurs rajouté le User_Agent de Cuill dans la liste des moteurs à reconnaître... et on le voit sur le Hub ! Dan : Petit problème avec les droits sur ton image postée ;o) Link to comment Share on other sites More sharing options...
LebossTom Posted October 22, 2007 Share Posted October 22, 2007 Très intéressant cet article on y voit un peu plus clair sur ce moteur furtif... Quand je vois ce que slurp bouffe en bande passante je me dis que GG avait déjà une énorme avance en terme d'efficacité de crawl... j'ai hâte de voir cuil tourner à plein régime . Link to comment Share on other sites More sharing options...
Djoule Posted October 22, 2007 Share Posted October 22, 2007 Tres bel article en effet. Dans la serie des bots-crawler inconnus ou presque, je viens de tomber sur cazoodle dans mes logs. Vous avez des infos la dessus? Link to comment Share on other sites More sharing options...
Cariboo Posted October 22, 2007 Author Share Posted October 22, 2007 http://www.cazoodle.com/ C'est un moteur monté par une startup américaine, qui sait crawler le web invisible et récupérer des données dans des bases de données (catalogues marchands en particulier). Link to comment Share on other sites More sharing options...
Djoule Posted October 22, 2007 Share Posted October 22, 2007 Merci Cariboo, j'etais allé faire un tour sur le site, mais j'avais pas compris grand chose. Link to comment Share on other sites More sharing options...
aurelien59 Posted October 23, 2007 Share Posted October 23, 2007 Merci Cariboo, j'etais allé faire un tour sur le site, mais j'avais pas compris grand chose. Oui mois aussi je vois pas trop c'est quoi :!: Link to comment Share on other sites More sharing options...
Anonymus Posted November 25, 2007 Share Posted November 25, 2007 Bonjour, Il est étonnant de voir qu'ils déposent des brevets sur le simple fait qu'ils arriveraient à indexer 100 milliards de pages. Cela semblerait dire que les indexes actuels seraient limités !? A priori, les moteurs majeurs ne donnent plus la taille de leur index depuis que celui-ci a atteint 20 milliards de pages. Là, tu parles de Archives.org, qui aurait... 30 milliards de pages. Si l'on suit la courbe classique d'évolution des matériels informatiques (style : capacité disque dur, etc..), c'est classiquement un doublement des capacités tous les ans. Pour les index des moteurs, on aurait pu s'attendre à quelque chose du même genre. Or ils semblent se trouver face à une limite de capacité , non ? (ou d'incapacité, à voir..) qui les obligeraient à penser leur index différemment !? De toute facon, le moteur de recherche Google sera dépassé un jour, et il le sera forcément par un algorithme radicalement différent. Reste à savoir comment celui-ci sera.. pensé. A noter que les nouveaux acteurs restent 'furtifs', parce qu'il est préférable de lancer des idées, avec un peu de 'présentation' derrière, que de se lancer réellement à l'assaut du marché. Vue la taille de la conccurence, autant assurer un minimum les arrières. Même si celui-ci se fait à coup de plusieurs millions de dollars (bon, le dollars est 'faible', en ce moment ) Enfin, à l'ère du Web 2.0, on ne trouve toujours pas de moteurs (aussi 'furtif' soit-il) qui soit capable de prendre en compte la personne derrière son écran. Que l'on soit jeune ou vieux, homme ou femme, le moteur sait ce qu'on cherche, avant même de savoir qui on est. Je reste perplexe devant ce genre de réflexions, qui me laissent à penser que tant que les chercheurs ne regarderont pas plus loin que leur algo, ils perdront en pertinence. Nico. Link to comment Share on other sites More sharing options...
thick Posted November 25, 2007 Share Posted November 25, 2007 Je ne veux pas jouer les pessimistes, mais les effets d'annonces à propos de moteurs révolutionnaires c'est pas le premier que je vois passer sans lendemain. Je souhaite toute la réussite possible à ce moteur, mais d'emblée quand il annonce qu'il va s'attaquer à Google grâce à des supériorités d'analyse sémantique je dois dire que c'est un peu faible comme argument. C'est pas le génie du moteur qui a fait le succès de Google, mais bien les liens sponsorisés contextuels. Au lieu de chercher à faire un meilleur moteur, je dis qu'il faudrait plutôt s'attaquer à mettre en place un meilleur système publicitaire. Qui peut aujourd'hui prétendre avoir une société qui pourrait s'arrêter de travailler et quand même générer des bénéfices monstrueux ? Personne à part Google et c'est pas son algorithme qui fait ça. Link to comment Share on other sites More sharing options...
Cariboo Posted November 25, 2007 Author Share Posted November 25, 2007 Il est étonnant de voir qu'ils déposent des brevets sur le simple fait qu'ils arriveraient à indexer 100 milliards de pages. Cela semblerait dire que les indexes actuels seraient limités !? A priori, les moteurs majeurs ne donnent plus la taille de leur index depuis que celui-ci a atteint 20 milliards de pages. Là, tu parles de Archives.org, qui aurait... 30 milliards de pages. Absolument, d'ailleurs Anna Paterson et Google avaient dévoilé le pot aux roses fin 2005 : leur index primaire ne faisait que 6 à 8 milliards de pages (les chiffres varient suivant ce qu'on compte), pour le reste ils avaient recours à un index secondaire, beaucoup moins à jour, et moins complet au niveau informations, avec des temps d'accès déplorable. Le problème, c'est que le nombre d'informations que Google veut stocker pour chaque page et chaque terme (ou groupe de termes) a aussi fortement augmenté. Donc la quantité d'information a stocker a été multipliée de beaucoup plus qu'un facteur 100 d'après ce que j'ai compris. C'est pas le génie du moteur qui a fait le succès de Google, mais bien les liens sponsorisés contextuels. Au lieu de chercher à faire un meilleur moteur, je dis qu'il faudrait plutôt s'attaquer à mettre en place un meilleur système publicitaire. Tout dépend de quoi on parle. Les adwords ont fait le succès financier de Google, et le principal problème des nouveaux entrants, c'est qu'ils n'ont pas les milliards de Google ou de Microsoft, et qu'ils finiront dans le meilleur des cas avalés par l'un des géants. Mais il faut quand même rappeler l'histoire de Google : c'est un moteur sans pub qui a "explosé" Altavista en quelques mois à la fin des années 2000. Les liens sponsorisés n'ont pas été inventés par Google, et ont très longtemps fourni des ressources limitées à Google. Les adsense (la techno ayant failli aussi aller chez Yahoo) et les bénéfices records n'arrivent qu'en juin 2003. Soit après des années de fonctionnement sans modèle économique sérieux. Pour réussir à contrer Google, il faut des ressources financières importantes ET une bonne techno. Les deux. Avec juste les moyens, on parvient seulement à exister comme pour MSN jusqu'à présent. Sinon je suis d'accord pour les effets d'annonce : dans l'immense majorité des cas, derrière un moteur furtif, il n'y a que du vent. Là, y'a déjà une réalité : on voit le crawler Twiceler partout, et tout le temps. La plupart des moteurs furtifs, étrangement, ne crawlent rien, ce qui est toujours mauvais signe. Mais on verra bien ce qu'ils vont nous sortir, et même, si le moteur sort un jour. Link to comment Share on other sites More sharing options...
thick Posted November 25, 2007 Share Posted November 25, 2007 Je dirais que pour contrer Google, il faut des moyens, une bonne techno ET un énooorme buzz. C'est principalement le buzz qui a fait le succès de Google (hormis son algo) avant les liens sponso. Link to comment Share on other sites More sharing options...
slender Posted March 4, 2009 Share Posted March 4, 2009 le phoenix renaît de ses cendres ici. Nouveau look, nouvelle présentation... Link to comment Share on other sites More sharing options...
Gorapat Posted March 5, 2009 Share Posted March 5, 2009 je ne le trouve pas pertinent exemple: si je cherche des infos sur une personne (prenom + nom), GG parait bien meilleur. Link to comment Share on other sites More sharing options...
Dan Posted March 5, 2009 Share Posted March 5, 2009 Il est bien trop branché U.S. ... peu de sites francophones à l'appel. Link to comment Share on other sites More sharing options...
Recommended Posts
Please sign in to comment
You will be able to leave a comment after signing in
Sign In Now