Aller au contenu

Urban

Hubmaster
  • Compteur de contenus

    217
  • Inscrit(e) le

  • Dernière visite

Messages postés par Urban

  1. Oui c'est bien l'aspi de msie, mais c'est normal qu'il ré-aspire tous les jours les sites dans leur totalité ? C'était surtout la le sens de ma question. Effectivement s'il continu tous les jours, je le bloquerais :twisted:

  2. Ceci n'est pas exactement un problème de référencement, mais de crawler. Depuis quelques jours, j'ai un internaute qui crawl certains sites chaque jour dans leur totalité avec l'user agent :

    Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Wanadoo 6.7; .NET CLR 1.1.4322; MSIECrawler)

    Je pense qu'il a choisi de rendre dispo offline les sites en question. Es-ce un fonctionement normal ? Chaque fois qu'il se connecte il crawl la totalité des sites ?

    Avez vous eu ce genre de problème ? Qu'avez-vous fait ? Rien ? Rewritecond sur l'UA ? robots.txt (j'ai cru comprendre que ce crawler respectait robots.txt) ?

  3. Et même si tu utilises l'outil du HUb, pense que les IPs sont différentes entre celle du serveur du Hub et celle de ta freebox. Donc google.com peut varier entre l'utilisation en local et l'utilisatin par l'outil.

    Dan

    <{POST_SNAPBACK}>

    Je n'ai pas regardé comment c'était fichu, mais ce n'est pas le navigateur qui génère la resolution de google.fr lorsque que l'on utilise les outils du hub ? Je pensais que c'était juste une requete vers google.fr dans une iframe.

  4. Pour essayer de te répondre Calimero (c'est là qu'on va voir si j'ai bien integré les leçons..hum...) le google.fr des outils du hub, te redirige , vers ton google.fr à toi du moment d'ou les similarités de résultats.. enfin c'est ce que je pense :blush:

    <{POST_SNAPBACK}>

    Ben forcement, puisque google.fr n'est pas un datacenter quand ton navigateur l'a résolu une fois et que tu vas sur le hub, tu obtiens les mêmes résultats.

  5. Ce n'est peut être pas exactement le même sujet, mais je viens de me rendre compte d'un truc. J'ai un site recent (lancé il y a quelques mois entre le dernier et l'avant dernier update de pr). Je n'ai mis mon outil de stats que depuis une semaine sur ce site. Il n'est crawlé que par "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"

  6. J'aimerais savoir s'il existe un plugin dotclear pour éviter les spam dans les commentaires, avec par exemple une vérification visuelle d'un code image ? En ce moment je reçois 4-5 spams par jour. J'ai vu que mcomment permettais de gérer plus facilement les commentaires, mais je n'ai pas trouvé d'antispam.

  7. J'ajoute que les versions en cache dans Big daddy par les liens "en cache" proposés par Google  ne montrent pas forcément la version "vraiment" prise en compte par ces data centers. On le constate en testant la présence de mots récemment ajoutés dans les pages. Ils ne sont pas dans les versions "en cache" présentées par Google et pourtant, les pages sortent dans les recherches sur ces mots. Ce qui ajoute à la confusion ambiante.

    <{POST_SNAPBACK}>

    De ce que j'ai remarqué, il y a parfois 2 semaines d'écart entre la version en cache et la version prise en compte dans l'index.

  8. Consernant exalead, faudrait peut être qu'ils fassent un peu de ménage dans leur index et qu'ils crawlent un peu plus... Pour une requête donnée, mon site sort avec son ancienne adresse sur la première page, et quand j'utilise la commande site: sur cette adresse, ça me sort des pages de 2002-2003 qui ne sont plus en ligne depuis plus de 2 ans. Entre manger au fast food et manger un truc périmé depuis plus de 2ans, si c'est les deux seuls choix que l'on me propose, j'ai vite choisi :D

  9. La table que tu n'as pas réinjectée est utilisée par le moteur de recherche de phpbb. Cela signifie que les recherches effectuées sur le forum ne trouverons jamais les anciens messages. Par contre pour ceux posté depuis ton import ça sera ok.

  10. J'ai un site pr3 qui ne sert plus à rien et n'évolue plus depuis pas mal de temps, il a un "futur pr" de 5 depuis 3 ou 4 update ;)

    Inversement sur un site en création, je suis monté à "futur pr" 5 pour redescendre a 4 alors qu'il n'y a eu que des ajout de backlink et de pages indexées, et que l'archi du site n'a pas changé.

    On ne peut pas conclure grand chose sur ce paramètre, même si des fois ça marche en tant que futur pr, il y a aussi des fois ou ça ne marche pas ;)

×
×
  • Créer...