|
Site Web : Pnambique Directeur du Pôle Experts de la société @position http://www.aposition.com Articles de l'auteur : La détection du Link Spam : un challenge pour les moteurs [3/4] La détection du Link Spam : un challenge pour les moteurs [2/4] La détection du Link Spam : un challenge pour les moteurs [Bibl.] La détection du Link Spam : un challenge pour les moteurs [1/4] Cuill veut surpasser Google grâce à l’analyse de données sémantiques 2007 : l’année des moteurs furtifs L’autre sémantique - Le Web Sémantique et les systèmes de recherche d’information. [3.4] L’autre sémantique - Le Web Sémantique et les systèmes de recherche d’information. [3.3] L’autre sémantique - Le Web Sémantique et les systèmes de recherche d’information. [3.2] L’autre sémantique - Le Web Sémantique et les systèmes de recherche d’information. [3.1] Joachim Kreibich (Seekport) : pour nous, un moteur de recherche de qualité doit tenir compte des particularismes linguistiques nationaux, voire régionaux Une tentative de définition du spamdexing Google Base dévoilé ! Les concepts de la POO La programmation objet : qu’est-ce que c’est ? à quoi ça sert ? Gregory Olivier "MSN Search cherche à établir un véritable dialogue avec les webmasters et les référenceurs" Direct Answers from Encarta MSN Search utilise-t’il l’analyse au niveau des blocs ? Spyware : les méthodes pour s’en débarasser Michael James, de la société Mirago "Nous misons sur nos partenaires pour développer notre visibilité" La sémantique appliquée et les outils de recherche [2/6] Linguistique statistique et sémantique appliquée : outil de pertinence pour les moteurs, de KM et de référencement ANALYSE THEMATIQUE (4/4) par le Pr E. Garcia ANALYSE THEMATIQUE (3/4) par le Pr E. Garcia Applications des outils sémantiques au référencement et aux moteurs de recherche Sémantique appliquée : Liens et références bibliographiques ANALYSE THEMATIQUE (2/4) par le Pr E. Garcia ANALYSE THEMATIQUE (1/4) par le Pr E. Garcia CIRCA : la technologie d’Applied Semantics au coeur des Adwords et des Adsense de Google [3] Mon premier programme en PHP (3e Partie) CIRCA : la technologie d’Applied Semantics au coeur des Adwords et des Adsense de Google [2] CIRCA : la technologie d’Applied Semantics au coeur des Adwords et des Adsense de Google [1] Quelques pistes pour comprendre le nouvel algorithme de Google (suite et fin) Quelques pistes pour comprendre le nouvel algorithme de Google FOOXX, le moteur futé venu d’Allemagne Le futur moteur que prépare Microsoft pour MSN sera-t’il Brilliant ? Mooter, un moteur de recherche innovant venu d’Australie Les techniques évoluées d’indexation dans les moteurs de recherche (2e partie) Visibilité et stratégies de développement d’audience sur le Web Les techniques évoluées d’indexation dans les moteurs de recherche L’algorithme HITS et le projet CLEVER (deuxième partie) L’algorithme HITS et le projet CLEVER La structure du web est en forme de "noeud papillon" Webfountain d’IBM Vers un moteur de recherche sensible au contexte (1ère partie) Vers un moteur de recherche sensible au contexte (2ème partie) Vers un moteur de recherche sensible au contexte (3ème partie) Droit d’auteur et site web Droit d’auteur et site web (2e Partie) Droit des producteurs de bases de données (législation française) Tester correctement variables et valeurs en php Mon premier programme en PHP (2e Partie) Les nouveautés de la version 5 de PHP Les origines du PHP Mon premier programme en PHP Pourquoi choisir le PHP pour réaliser des pages dynamiques ? |
Joachim Kreibich (Seekport) : pour nous, un moteur de recherche de qualité doit tenir compte des particularismes linguistiques nationaux, voire régionaux
[une interview exclusive du gérant de Seekport France]Joachim Kreibich (Seekport) : pour nous, un moteur de recherche de qualité doit tenir compte des particularismes linguistiques nationaux, voire régionaux7 avril 2006, par Cariboo
PY : Dans un marché ultra-dominé par des moteurs US, Seekport a lancé un moteur "grand public", présent dans plusieurs pays européens ! Y’a-t’il encore une place pour un nouvel acteur BtoC parmi les outils de recherche ? Joachim Kreibich : nous le croyons vraiment. Sur le marché "B to B", il y’a eu une concentration autour de quelques grands acteurs. Notre société représente donc une alternative intéressante, en tant que fournisseur de technologies pour les acteurs à la recherche d’autres solutions. Sur le marché de la recherche "grand public", notre moteur est aujourd’hui notre vitrine technologique, mais nous pensons véritablement être en mesure de trouver notre place, notamment grâce à la qualité de notre index et de nos pages de résultats. Vous pensez donc être en mesure de faire mieux que les moteurs que nous connaissons déjà ? Oui nous pensons qu’il est possible de faire mieux que les outils de recherche les plus connus dans le domaine de la pertinence de leurs résultats. La plupart des grands moteurs de recherche sont parfaitement étudiés pour la langue anglaise et les états Unis, mais dès que l’on se trouve dans un autre pays, et que l’on consulte des résultats dans d’autres langues, ce n’est plus la même chose. Seekport a pour ambition de combler cet écart qualitatif en Europe, en travaillant à améliorer la qualité des index dans chaque pays, chaque langue européenne. Vous trouvez les autres moteurs moins pertinents ? Le problème, c’est qu’un moteur de recherche comme Google est pensé comme un outil "global" : il donne en général des résultats corrects, mais il est clair que l’index francophone est pollué, du point de vue d’un belge ou d’un suisse, par des résultats de sites français ou canadiens. Les moteurs de recherche et leurs index doivent, pour être plus pertinents, plus utiles, plus efficaces, respecter les particularismes linguistiques, nationaux, voire régionaux. Vous voulez créer un moteur par région ? L’europe est une mosaïque de peuples, de langues, et faire un index "national" n’a pas beaucoup de sens dans certains pays. En Espagne par exemple, nous avons créé quatre versions de l’index : en castillan, catalan, basque et galicien. En France, nous créons un moteur pour les français... Les sites canadiens n’ont donc rien à faire dans l’index.
Mais comment amener le grand public à effectuer des recherches sur Seekport ? Nous comptons notamment sur les partenariats que Seekport a déjà noué et continue de développer. Notre technologie permet de créer des outils de recherches en marque blanche pour de nombreux acteurs : portails, ISP, sites, fournisseurs de noms de domaine. Notre particularité, c’est de disposer d’index permettant de créer des outils de recherche "verticaux", thématique par thématique. Les fonctionnalités de recherche thématiques que l’on trouve sur la version grand public du moteur sont une bonne démonstration de ces possibilités. Les liens sponsorisés présents sur votre moteur émanent de la société ... Infospace ! Quel partenariat avez-vous conclu avec eux, et d’où émanent exactement ces annonces publicitaires ? Oui, nous sommes parmi les premiers sites à mettre en ligne les liens fournis par Infospace. Cette société américaine a conclu un accord avec Google, Overture et Miva, et affiche les annonces émanant de l’un ou l’autre de ces trois acteurs, en fonction de critères d’optimisation des clics et des revenus. C’est un partenariat stratégique, qui permet également à Seekport d’être une alternative intéressante en tant que fournisseur de liens sponsorisés. Infospace va créer une représentation en Europe ? Pour l’instant, nous sommes les premiers utilisateurs de la technologie Infospace en Europe, et nos accords prévoient que nous les représentions sur le marché Européen. Sur le plan technologique, quels sont les particularités du moteur Seekport ? Nous fournissons une recherche internet de haute qualité sans spam grâce à une technologie innovante et une équipe d’indexation française. L’une des premières particularités, c’est l’existence d’index gérés séparément, avec un "responsable de l’index" pour chaque version de Seekport. En France, c’est Renaud Guyon qui est en charge de cette tâche. Renaud Guyon, quel est exactement la mission d’un responsable de l’index chez Seekport ? Renaud Guyon : et bien c’est simple. Cela consiste à identifier les défauts ou les améliorations possibles dans l’index généré automatiquement par notre robot, Seekport, et à procéder aux changements nécessaires. Sur quoi intervenez vous en particulier ? Et bien il y’a bien sûr tout ce qui relève de la lutte contre le spam, ou de l’élimination des pages non pertinentes dans les pages de résultats. C’est important que cela soit géré au niveau local, car pertinence et spam sont des notions subjectives, et un canadien et un français ne vont pas forcément identifier les mêmes pages comme du spam, ou une pollution des résultats. Il y’a aussi les pages "manquantes" que nous décidons d’ajouter manuellement. Car certains sites importants ou utiles sont parfois mal fichus, et il faut parfois intervenir pour éviter qu’une indexation 100% automatique prive les internautes des pages qu’ils recherchent. Bref je suis le garant de la qualité de l’index de Seekport France. Et les index thématiques : comment sont-ils réalisés ? Avant tout automatiquement. Nous avons développé un algorithme de clustering qui permet une catégorisation automatique des pages. Pour créer un nouveal index thématique, il suffit de fournir au système un corpus d’entrainement, ensuite il saura reconnaître tout seul si une page doit ou non figurer dans cet index. Cet outil a d’autres applications. Nous envisageons par exemple de proposer à terme un outil de protection des mineurs différent, basé sur l’identification des pages "adultes", et non sur une labellisation positive ou négative de sites entiers. En effet, sur un portail comme Lycos, il y’a des pages qui ne devraient pas être accessibles par un enfant de dix ans. Ces pages sont minoritaires, c’est pourquoi l’accès à Lycos est possible sur la plupart des outils de restriction d’accès. La réponse est dans la catégorisation automatique des pages, et non du site... Mais ça c’est pour plus tard. Seekport, c’est aussi d’autres outils avancés, comme la recherche dans les news, dans les catalogues de produits, dans les images, la fonctionnalité "définitions", ou la recherche dans les blogs. Cette dernière fonctionnalité est d’ailleurs particulièrement stratégique en France, vu le nombre de blogs créés par les internautes français, qui sont de loin les plus grands bloggeurs européens. Bref, Seekport dispose déjà de la panoplie complète des fonctionnalités attendues de la part d’un moteur grand public. Quel est votre position par rapport au projet Quaero ? Nous sommes une société profondément européenne, et tout ce qui permet le développement d’une alternative aux moteurs US en Europe nous parait aller dans le bon sens. Quaero est donc un projet que nous suivons avec la plus grande attention. Merci à toute l’équipe de Seekport pour sa disponibilité dans le cadre de la réalisation de cette interview Interview réalisée par Philippe YONNET
|
|
||
|