Aller au contenu

Pedrolito

Membre
  • Compteur de contenus

    9
  • Inscrit(e) le

  • Dernière visite

Messages postés par Pedrolito

  1. Sans vouloir te vexer, ça n'est donc forcément pas super fiable : tu n'as pas les reins d'un Google ou d'un Bing et ton index est fatalement tronqué, non ?

    Tu as une politique de réindexation des pages déjà existantes ?

    L'objectif n'est pas d'atteindre l'exhaustivité (virtuellement impossible) mais de dire : tout ce que cela peut fournir est dèjà cela de pris. Par exemple pour faire de la veille concurrentielle.

    En tout état de cause c'est déjà plus complet pour les sites traités que la méthode exploitant les pages de recherche google ou yahoo limitée en nombre.

  2. Sinon, comment génères-tu ta liste de sous-domaines pour un site ? Et celle des sites liés ?

    C'est expliqué sur le site : wholinks a ses propres spider qui analysent le contenu des pages des sites.

    En ce qui concerne les sites liés ... c'ets un algo "maison" qui se base sur une demi douzaine de critères pour décider ou non si tels et tels sites font partie d'un même réseau de sites (c'est en fait la partie qui a été la plus complexe a coder ... pour éliminer au maximum les faux positifs ...)

  3. Bonjour, tu devrais peut-être faire une version en français.

    La problématique :

    1 - Le site par son contenu est totalement international

    2 - Il est hebergé au canad et localisé USA dans Google webmaster tools

    3 - La version française existe puisque ce sont simplement deux fichier langue-fr et langue-en que j'utilise (actuellement seul le en est accessible)

    4 - Je n'ai pas encore choisi la stratégie de rewrite au niveau du multilangue (en fait j'hésite sur le bon choix)

    5 - Le probleme va être un probleme de duplicate car fr ou en, hormis quelques termes d'interface, les contenus sont les memes au caracteres pres par definition.

    6 - Comme le contenu est internationnal par définition, j'ai opté pour le moment pour la solution de facilité : tout en anglais.

  4. Merci pour ses infos.

    Intéressant ton site même si moi j'en aurai pas l'utilité pour l'instant.

    Pour free, il y a environ 4100 sous domaines, les sites persos font partie car je ne trouve pas mes sites persos.

    Oui oui tous les sous domaines de free (et de quelque domaine que ce soit d'ailleurs) sont traités ... simplement "spout" et "nik" ont un peu de travail :cool: et donc c'est par définition incomplet (la bse de 3 millions de sites doit représenter a peine 1 % du web mondial ... ils ont encore du taf en vue :cool: )

  5. j essaye de te répondre mais mes posts ne passent pas ? tu es sous quel navigateur ?

    c'est normalement ok sous IE et FF mais ca plante sous chrome (me reste un peu de debug)

    Sinon le concept ets simple. Tu selectionne un domaine et tu obtiens :

    - la liste de ses sous domaines

    - la liste des autres sites du même "réseau" ...

    exemple : www.wholinks.org/report-actimonde.com.html

    ou un avec pleins de sous domaines : Free

    edit : je viens de comprendre pourquoi mes posts ne passaient pas : je saisissais directement l'url avec le ht-- etc etc ... et il aimait pas.

×
×
  • Créer...