|
Site Web : Pnambique Directeur du Pôle Experts de la société @position http://www.aposition.com Articles de l'auteur : La détection du Link Spam : un challenge pour les moteurs [3/4] La détection du Link Spam : un challenge pour les moteurs [2/4] La détection du Link Spam : un challenge pour les moteurs [Bibl.] La détection du Link Spam : un challenge pour les moteurs [1/4] Cuill veut surpasser Google grâce à l’analyse de données sémantiques 2007 : l’année des moteurs furtifs L’autre sémantique - Le Web Sémantique et les systèmes de recherche d’information. [3.4] L’autre sémantique - Le Web Sémantique et les systèmes de recherche d’information. [3.3] L’autre sémantique - Le Web Sémantique et les systèmes de recherche d’information. [3.2] L’autre sémantique - Le Web Sémantique et les systèmes de recherche d’information. [3.1] Joachim Kreibich (Seekport) : pour nous, un moteur de recherche de qualité doit tenir compte des particularismes linguistiques nationaux, voire régionaux Une tentative de définition du spamdexing Google Base dévoilé ! Les concepts de la POO La programmation objet : qu’est-ce que c’est ? à quoi ça sert ? Gregory Olivier "MSN Search cherche à établir un véritable dialogue avec les webmasters et les référenceurs" Direct Answers from Encarta MSN Search utilise-t’il l’analyse au niveau des blocs ? Spyware : les méthodes pour s’en débarasser Michael James, de la société Mirago "Nous misons sur nos partenaires pour développer notre visibilité" La sémantique appliquée et les outils de recherche [2/6] Linguistique statistique et sémantique appliquée : outil de pertinence pour les moteurs, de KM et de référencement ANALYSE THEMATIQUE (4/4) par le Pr E. Garcia ANALYSE THEMATIQUE (3/4) par le Pr E. Garcia Applications des outils sémantiques au référencement et aux moteurs de recherche Sémantique appliquée : Liens et références bibliographiques ANALYSE THEMATIQUE (2/4) par le Pr E. Garcia ANALYSE THEMATIQUE (1/4) par le Pr E. Garcia CIRCA : la technologie d’Applied Semantics au coeur des Adwords et des Adsense de Google [3] Mon premier programme en PHP (3e Partie) CIRCA : la technologie d’Applied Semantics au coeur des Adwords et des Adsense de Google [2] CIRCA : la technologie d’Applied Semantics au coeur des Adwords et des Adsense de Google [1] Quelques pistes pour comprendre le nouvel algorithme de Google (suite et fin) Quelques pistes pour comprendre le nouvel algorithme de Google FOOXX, le moteur futé venu d’Allemagne Le futur moteur que prépare Microsoft pour MSN sera-t’il Brilliant ? Mooter, un moteur de recherche innovant venu d’Australie Les techniques évoluées d’indexation dans les moteurs de recherche (2e partie) Visibilité et stratégies de développement d’audience sur le Web Les techniques évoluées d’indexation dans les moteurs de recherche L’algorithme HITS et le projet CLEVER (deuxième partie) L’algorithme HITS et le projet CLEVER La structure du web est en forme de "noeud papillon" Webfountain d’IBM Vers un moteur de recherche sensible au contexte (1ère partie) Vers un moteur de recherche sensible au contexte (2ème partie) Vers un moteur de recherche sensible au contexte (3ème partie) Droit d’auteur et site web Droit d’auteur et site web (2e Partie) Droit des producteurs de bases de données (législation française) Tester correctement variables et valeurs en php Mon premier programme en PHP (2e Partie) Les nouveautés de la version 5 de PHP Les origines du PHP Mon premier programme en PHP Pourquoi choisir le PHP pour réaliser des pages dynamiques ? |
CIRCA : la technologie d’Applied Semantics au coeur des Adwords et des Adsense de Google [1]
Les principes des outils sémantiques utilisés par Google pour ses programmes de pubCIRCA : la technologie d’Applied Semantics au coeur des Adwords et des Adsense de Google [1][1ère partie : d’Oingo à Applied Semantics]19 septembre 2004, par CaribooLes programmes Adwords et Adsense sont devenus la principale source de revenus de Google. Petit à petit, à force de les voir associés à Google, on oublie que ces publicités contextuelles sont en réalité une invention d’une société californienne, Applied Semantics, qui a eu une longue histoire avant d’être finalement rachetée par Google. De Oingo à Applied SemanticsEn 1998 (Google venait juste de pousser ses premiers vagissements en sortant de son oeuf en briques de Lego), deux jeunes diplômés de Caltech, Gil Elbaz et Adam Weissmann, créaient un nouveau moteur de recherche : Oingo [1]. Un moteur qui, selon son créateur lui-même, "indexait non plus les mots, mais le sens des mots"... En novembre 1998, les deux ingénieurs créent la société Oingo Inc pour exploiter leur technologie, Gil Elbaz en devenant le PDG. Le moteur de recherche est présenté au public en octobre 1999, en version bêta, à l’occasion du salon "Fall 1999 Internet World" où il remporte un prix. Le moteur sera lancé officiellement en décembre de cette même année. La société Oingo propose son moteur en marque blanche à de nombreux sites. La technologie Oingo s’appuie sur le travail de huit linguistes qui sont partis du lexique sémantique élaboré à Princeton : Wordnet, pour élaborer une ontologie opérationnelle couplée avec des algorithmes de recherche. Cette technologie, Elbaz et Weissmann l’avaient baptisée "CIRCA" : Conceptual Information Retrieval and Communication Architecture [2] L’index Oingo comportait au départ tous les sites listés dans l’ODP. Le moteur Oingo fonctionnait de la façon suivante :
En 1999/2000, ce système semblait totalement innovant et prometteur. En 2004, il semble toujours aussi innovant et prometteur... Mais très vite, Gil Elbaz sent le vent tourner : les modèles économiques permettant de rentabiliser son moteur de recherche ne sont pas mûrs. Or la technologie CIRCA permet d’attaquer d’autres marchés, celui des grandes entreprises, et moins vers le grand public. Oingo lance trois nouveaux produits, en ciblant les entreprises du secteur de la finance, les laboratoires pharmaceutiques et de biotechnologie, et les entreprises de presse :
Pour mieux marquer ce changement de stratégies, Oingo Inc change de nom en mai 2001 et devient "Applied Semantics". Genèse du programme AdSenseLa technologie CIRCA a de nombreuses applications possibles, et ces applications ont été explorées très tôt, bien avant que les dirigeants de la société californienne aient pu se rendre compte de leur potentiel sur le marché. C’est ainsi qu’un accord de partenariat commercial avec le registrar alldomains.com aboutit dès octobre 2000 au lancement du programme "Domainsense". Domainsense est capable de proposer à un webmaster à la recherche d’un nom de domaine adapté à son projet de site, une liste de domaines libres en rapport avec ses premières recherches. En parallèle, l’équipe d’Oingo travaille depuis un an à un produit de publicité ciblé, baptisé Adsense, capable de servir des publicités en rapport avec le contenu des pages. A l’automne 2000, le produit est au point et figure dans le "catalogue" d’Oingo. A ce moment, il ne s’agit que de publicités traditionnelles (bannières graphiques) et peu de sites s’intéressent à cette technologie ! La publicité sur internet est en pleine explosion, nous sommes en pleine phase de gonflement de la bulle et de folie des start-up, et le besoin de "cibler" les annonces n’apparait pas comme vital... En fait, il faudra attendre deux ans pour que la technologie Adsense commence à intéresser des portails grand public. Les publicités contextuelles enfin testées En octobre 2002, Applied Semantics décide de relancer le projet Adsense et cherche des diffuseurs pour tester en vraie grandeur les annonces contextuelles. Le premier site à accepter est USA Today, qui signe un accord à titre de test en février 2003. Dans la foulée, Excite et iWon testent cette nouvelle technologie, ainsi que le site du San Francisco Chronicle. Février/Mars 2003 : la course aux pubs contextuelles Parallèlement, une guerre commerciale s’est engagée entre Overture et Google. Overture vient de racheter plusieurs moteurs de recherche, dont Altavista et Fast, afin de gagner des parts de marché sur le marché des moteurs de recherche et d’acquérir des technologies. Google réagit en tentant de prendre une avance technologique, et développe à marche forcée un programme de publicité contextuelle. Fin février, le lancement du programme par Google est annoncé comme imminent, et Overture se fend d’un communiqué (le 25 février 2003) pour annoncer qu’ils ont un projet similaire dans les cartons. Dans ce communiqué, Overture annonce que la technologie qu’ils envisagent s’appuient sur celle de Keylime, une petite société achetée en janvier. C’est un pieux mensonge... Le programme d’Overture est loin d’être au point. Mais Overture dispose, par l’intermédiaire de l’un de ses partenaires commerciaux, d’une arme secrète. Cet arme, c’est Adsense, et le partenaire commercial, Applied Semantics. La société californienne est en effet un partenaire privilégié d’Overture depuis des mois, grace à DomainPark, un système de publicité ciblée sur les pages "parking" de domaines non utilisées, dont Overture assure la régie. Les négociations entre Overture et Applied Semantics s’engagent. Objectif : contrer Google, et lancer rapidement un programme de liens sponsorisés contextuels ... mars 2003 : Google lance ses liens contextuels Le 4 mars 2003, Google annonce la création de son programme de publicité contextuelle... extrait du communiqué de Reuters Les relations personnelles entre Gil Elbaz et Larry Page vont jouer un rôle essentiel dans la suite des opérations... Les deux hommes, qui ont un parcours très similaire, à force de se croiser, sont devenus amis. Google va donc proposer à Applied Semantics le rachat de la société, à des conditions très avantageuses... avril 2003 : Google rachète Applied Semantics En quelques semaines, l’affaire est conclue, et le 23 avril 2003, la vente d’Applied Semantics est annoncée publiquement. Le camouflet infligé à Overture est flagrant ! Dans la guerre larvée qui opposait Yahoo/Overture à Google, ces derniers venaient de remporter une bataille stratégique, en privant Overture de la technologie Adsense. Overture s’est ingénié à minimiser l’impact de cette vente. Voilà ce que déclarait à l’époque Al Duncan à Chris Sherman de Jupiter Media : "Il y’a une faiblesse inhérente à une approchement purement technologique comme celle du produit d’Applied Semantics. Notre produit à nous combinera des processus technologiques et éditoriaux (des filtres à haute sensibilité qui sont indispensables pour éliminer des concordances malheureuses. Par exemple, un article sur un accident d’avion avec des liens pour des voyages." Google Content-Targeted Advertising devient ... Google Adsense Par contre, si tous les observateurs ont salué le "coup" réussi par Google avec ce rachat, la plupart s’attendaient à ce que la technologie Adsense soit rangée dans un placard en attendant des jours meilleurs... Car Google venait déjà de lancer sa propre technologie ! Il n’en a rien été ... Quelques semaines plus tard (18 juin 2003), le programme de liens contextuels de google change de nom, et de technologie, et devient ... Google Adsense ! En novembre 2003, le programme Adsense s’ouvre aux sites francophones... en quelques semaines, de nombreux webmasters français découvrent ce nouveau système et l’installent sur leur site. Beaucoup s’étonneront en découvrant qu’effectivement, Adsense est capable d’analyser les pages en quelques minutes, et de délivrer des liens publicitaires adaptés au contenu de la page. Mais quels sont les principes de fonctionnement d’Adsense ? C’est ce que nous développerons dans la deuxième et la troisième partie de cet article :
Philippe YONNET BIBLIOGRAPHIE ET LIENS UTILESL’article de Paula J. Hane dans Infotoday sur Oingo
Le communiqué commun de Alldomains et Oingo
Le site (fermé) d’Applied Semantics
Wordnet Fellbaum, C. (1998)."WordNet : An Electronic Lexical Database". MIT Press USA Today teste le programme Adsense - 10 février 2003 _http://www.editorandpublisher.com/eandp/news/article_display.jsp ?vnu_content_id=1813932 Article de NewsAndTech sur l’accord avec USA Today
Communiqué d’Overture du 25 février 2003 - annonce d’un programme de pub contextuelle http://www.clickz.com/news/article.php/1607621 Communiqué de Google du 4 mars 2003 - lancement du programme de pub contextuelle http://www.google.com/press/pressrel/advertising.html [1] L’origine du nom Oingo est assez mystérieuse. Voila la seule chose que Gil Elbaz a dévoilé à ce sujet :"Oingo est en fait un acronyme, mais nous ne dévoilerons pas ce que cela recouvre pour le moment. Cela a un rapport étroit avec notre prochain projet important, et nous ne voulons pas donner d’indications avant d’y être obligés.". Certains ont pensé que c’était une allusion au groupe californien Oingo Boingo, dont la musique a toujours été considérée comme "inclassable". Il est plus probable que le mot "ontologie" figure quelque part dans cet acronyme. [2] Ce qui pourrait se traduire par "Architecture de Communication et d’extraction d’information conceptuelle" |
|
|
||
|