Synthèse géographique: différence entre webalizer et Analytics
#1
Posté 05 mars 2009 - 09:35
J'utilise ces deux outils pour suivre les stats de mon site.
J'ai pu me faire une idée précise concernant la fiabilité de l'un et l'autre sur les visites (voir ici ou là)
Mais je me demande ce qui provoque des différences aussi importantes sur la provenance des visiteurs (Synthèse géographique ou Usage by countries)
GG Analytics donne par exemple 51% de visites venant de France alors que Webalizer indique 28%. Que signifie dans Webalizer «Unresolved/Unknown» et «Network» ?
Pourquoi ces différences ? Qui est le plus fiable sur la partie provenance géographique ? Est ce que tous les deux se basent sur les adresse IP et la géolocalisation des visiteurs ?
Merci d'avance
Philippe
#2
Posté 05 mars 2009 - 13:34
Déjà comparer deux systèmes non-comparables, c'est une drôle d'idée.
Analytics est un marqueur Javascript externe. Et Webalizer est un analyseur de logs.
Donc déjà, d'office, ils ne te fourniront pas les mêmes données.
Sinon, «Unresolved/Unknown» ou «Network» correspondent souvent à une IP sur laquelle il n'est pas possible de faire un reverse DNS.
Typiquement: une IP d'entreprise, quand des visiteurs viennent sur ton site depuis l'ordinateur de leur bureau.
Ensuite, un reverse DNS en et «.....wanadoo.fr» (Orange) sera forcément comptabilisé comme une visite française, à cause du TLD .fr
Alors que et «.....gaoland.net» (Neuf Télécom) ne le sera pas forcément, ça dépend des outils de stats: certains font une liste des FAIs par pays (plus lourd mais plus précis), certains ne se fient qu'au TLD.
#3
Posté 05 mars 2009 - 14:24
Merci pour ta réponse.
Je suis bien d'accord avec toi, les deux outils sont très différents, mais à ce que j'ai lu GG Analytics semblerait plus près de la réalité (?!) Voir les liens que j'ai mis dans mon post initial.
Ma question était motivée par une étude que je fais afin de démontrer les avantages et défauts de chacun à propos des stats de mon site. Lors du lancement du site on n'utilisait que Webalizer. Les résultats étaient encourageants. Et n'étaient pas contestés. Deux ans après j'ai installé Analytics. Ce qui a provoqué un choc ! Normal, tellement il y avait de différence en terme de visites et pages vues !
Maintenant j'ai compris la spécificité de chacun des deux outils.
Mais concernant la provenance des visiteurs ça n'était pas clair pour moi.
J'ai pas bien compris ce qu'est un reverse DNS. Peux tu m'en dire plus ?
Donc si je comprends bien, Webalizer se base sur les domaines ? Si un domaine est en .com, il considérera la visite venant des Etats Unis ? Et Google Analytics, sur quoi se base t'il pour définir la provenance des visites ?
Pour les stats de mon site, Webalizer annonce 35% de Network et 12% Unresolved/Unknown. Soit 47% de visites non déterminées du point de vue géographique. Cela fait beaucoup tout de même. Du coup c'est normal que Webalizer donne un % inférieur de visites venant de France que GG. Comme mon site est en trois langues, ces différences sont très troublantes et amènent à des conclusions fausses. Je voudrais donc pouvoir faire des analyses plus fines et exactes sur la provenance des visites de mon site.
Ce qui m'amène à croire qu'Analytics doit être plus proche de la réalité tout de même en terme de provenance des visites (?!)
Philippe
#4
Posté 05 mars 2009 - 14:49
ensemblevide, le jeudi 5 mars 2009 à 14:24, dit :
Pour moi, un analyseur de logs est forcément plus proche de la réalité.
Bref, c'est un débat sans fin, il y a les aficionados des deux.
ensemblevide, le jeudi 5 mars 2009 à 14:24, dit :
Prend-il en compte les visites des robots (notamment ceux de moteurs de recherche) ? Vu qu'Analytics ne les compatibilise pas comme visiteurs, ça crée des écarts énormes.
Analytics ne prend pas non plus en compte les visiteurs qui désactivent JS (c'est mon cas) alors que Webalizer si. Certes, les sans-JS ne sont pas légion, mais c'est un coup à faire une différence sensible à hauteur de quelques pourcents.
ensemblevide, le jeudi 5 mars 2009 à 14:24, dit :
Par exemple, tu as posté ce message avec une adresse IP qui se résoud en host.154.**.**.**.rev.coltfrance.com (j'ai masqué certains chiffres par confidentialité)
Certaines adresses IP ne peuvent pas être résolues: il n'y aura pas de reverse DNS. C'est vraisemblablement ce qui finit en «Unresolved/Unknown» dans tes stats.
ensemblevide, le jeudi 5 mars 2009 à 14:24, dit :
Un domaine .com ne sera jamais considéré comme venant des États-Unis. Les États-Unis c'est .us
Les TLDs en deux lettres sont nationaux (.fr pour la France, .us pour les États-Unis, .dz pour l'Algérie, .pl pour la Pologne, etc.)
Les TLDs en 3 lettres et plus sont généraux (.com pour commercial, .org pour les organisations, etc.)
À lire dans les publications du Hub: Les noms de domaine et leurs extensions
Quant à savoir sur quoi Analytics se base, personne ne le sait à part les gars de chez Google
#5
Posté 05 mars 2009 - 15:50
Citation
bon alors admettons que le débat soit sans fin
Par contre de nombreux messages qui parlent de Webalizer disent que, par exemple, "quelqu'un place une image de ton site sur le sien, chaque fois qu'elle est affichée par un visiteur, celui-ci est compté comme un visiteur sur ton site alors qu'il n'a rien vu de ton site. "
Ca peut être une explication de la différence entre Webalizer et Analytics à propos des visites.
Citation
Prend-il en compte les visites des robots (notamment ceux de moteurs de recherche) ? Vu qu'Analytics ne les compatibilise pas comme visiteurs, ça crée des écarts énormes.
Merci de poser la question, j'étais en train de lister les « crawler », « spider » ou « bot » trouvé dans la partie « Top 50 of 18016 Total Sites » de février 2009 de Webalizer :
339 visites llf531098.crawl.yahoo.net (robot yahoo)
418 visites de crawl-66-249-71-45.googlebot.com (robot Google)
414 visites de crawl-66-249-71-47.googlebot.com (robot Google)
409 visites de crawl-66-249-71-46.googlebot.com (robot Google)
321 visites de crawl13.exabot.com (robot Exalead)
59 visites de tc-gw.exabot.com (robot Exalead)
26 visites de crawler6132.ask.com (robot de Ask)
...
sur les 50 1er sites listés il y a 26 robots !!!! En je ne connais pas les sites suivants...
Merci pour tes explications sur le revers DNS
Citation
oui et les .net
Ils sont comptabilisés où dans Webalizer ?
Que veut dire "US Commercial" dans "Total countries" de Webalizer. Les .com ne seraient ils pas comptés ici ?
J'ai trouvé une catégorie "Non-Profit Organization". Ce ne seraient pas des .org ?
Bref Webalizer est très troublant !
Citation
hum
Je viens de trouver cette page
Peut être un début de piste ?
#6
Posté 05 mars 2009 - 22:52
Le problème que tu évoques provient de la méthode utilisée par Webalizer pour géolocaliser. Webalizer se base sur des requêtes DNS et il suppose que toute adresse .fr vient de France, tout .be vient de Belgique, etc. C'est assez correct, sauf pour les .com, .net, .org qu'il considère tous comme américains alors qu'on en trouve partout. Comme les .com peuvent représenter une part non négligeable de tes visiteurs, cela fausse tout.
Avec AWStats, il y a d'excellents plugins gratuits de géolocalisation (database d'adresses IP avec leur localisation). Je suppose que la géolocalisation de GA fonctionne selon le même principe que AWStats. Dans ce cas-ci, Google Analytics est donc plus correct que Webalizer.
Jean-Luc
Testeur de redirection (301, 302, meta refresh,...)
Le Grand Annuaire : comme DMOZ, mais avec indexation super-rapide
#7
Posté 06 mars 2009 - 00:05
Citation
Et on peut penser que la base d'IP de google est assez fiable puisqu'il arrive a relativement bien geolocaliser les pubs adwords
- Mon petit site a moi
#8
Posté 06 mars 2009 - 04:42
#9
Posté 06 mars 2009 - 06:07
Le truc c'est qu'aucuns système ne peux connaître comment un hebergeur ou FAI exploite les adresses IP qui lui ont été fournies. Normalement des séries de plages IP ont été attribuées aux différents pays mais avec tout le jeux des rachats certains FAI couvrent désormais plusieurs pays et quand ils sont en rupture de stock d'IP dans un pays ils ne se gênent pas pour attribuer celle d'un autre.
Pour le cas d'ovh, ce derniers disposes d'IP étrangères pour pouvoir geologaliser les domaines dans le pays ou l'on souhaite. OVH a donc probablement donne a Dan une mauvaise IP
- Mon petit site a moi
#10
Posté 06 mars 2009 - 09:31
C'est la géolocalisation faite par Google qui est parfois fantaisiste
Si la pratique et la théorie sont réunies, rien ne fonctionne et on ne sait pas pourquoi. - Albert Einstein -
Infogérance de serveurs dédiés OVH
#11
Posté 06 mars 2009 - 09:43
Merci à vous tous pour vos réponses très éclairantes.
Avant de continuer, je tiens apporter quelques précisions. Mon site est hébergé en mutualisé, et c'est donc mon hébergeur qui fournit Webalizer. La version actuellement est la 1.30 (elle date de 1999 !!!)
Citation
Du coup je ne pense pas que ça soit possible de pouvoir installer AWStats sur mon espace, je n'ai pas la main sur le serveur.
Citation
Merci pour la confirmation. Sur cette page il y a un graphique qui confirme :
Network c'est bien le .net, US Commercial, bien le .com. D'après mes recherches Webalizer, sur le version 2.0 affiche les correspondances. Faire une recherche sur GG avec "webalizer network", de nombreuses pages de stats de site avec webalizer sont listées.
Citation
Il n'y a donc pas de solution parfaite; mais une mieux que l'autre
Concernant toujours le sujet sur la provenance des visiteurs, comme Webalizer comptabilise les robots dans les visites (voir plus haut), pensez vous qu'il les compte aussi dans cette catégorie ? Un bot Google avec googlebot.com ça pourrait bien se retrouver dans "Us commercial" ??
Philippe
#12
Posté 06 mars 2009 - 10:49
Dan, le vendredi 6 mars 2009 à 09:31, dit :
C'est la géolocalisation faite par Google qui est parfois fantaisiste
- Mon petit site a moi
#13
Posté 06 mars 2009 - 15:14
ensemblevide, le vendredi 6 mars 2009 à 09:43, dit :
Si oui, et même si ton hébergeur ne t'autorise pas à installer AWStats sur ton serveur, il te reste toujours la possibilité d'installer AWStats en local et lui donner à analyser les fichiers logs que tu rapatrierais sur ton ordinateur.
C'est vrai que certains hébergeurs ont des analyseurs de logs un peu vieillots. Je me demande toujours pourquoi OVH, sur mutualisé, fournit Urchin vieille version. Ce pauvre Urchin est complètement dépassé et ne sert à rien.
Par curiosité, c'est qui ton hébergeur ?
#14
Posté 06 mars 2009 - 16:15
Citation
Comment le savoir ? Je ne sais pas. Mais il me semble ne pas avoir de grandes possibilités.
Citation
J'ai un basic (une vieille formule) chez Nfrance
Sinon pensez vous que les bots GG, Yahoo et co sont comptabilisés dans Webalizer, dans les provanances des visites, parmi "US Commercial" ?
Philippe
#15
Posté 06 mars 2009 - 16:45
ensemblevide, le vendredi 6 mars 2009 à 16:15, dit :
Sinon (probablement le cas de ton Webalizer), alors c'est sûr qu'ils sont inclus dans les visiteurs, et donc dans "US Commercial". Tu les retrouveras probablement en cliquant sur "Agents", puis sur "View All User Agents": tu trouveras Googlebot, Slurp et les autres dans la liste avec un pourcentage de trafic. Peut-être que ces pourcentages t'aideront à clarifier les choses.
Jean-Luc
Testeur de redirection (301, 302, meta refresh,...)
Le Grand Annuaire : comme DMOZ, mais avec indexation super-rapide
#16
Posté 06 mars 2009 - 16:46
ensemblevide, le vendredi 6 mars 2009 à 16:15, dit :
Je n'ai jamais utilisé leur service d'hebergement, donc je ne saurais pas te guider.
Citation
#17
Posté 09 mars 2009 - 16:31
Merci à tous pour votre participation. J'ai toutes mes réponses.
Certains d'entre-vous utilisent ils Webalizer ? En êtes vous satisfait ?
Citation
Oui c'est mon cas, comme mentionné plus haut.
Citation
j'ai rien trouvé. Tant pis.
Philippe



Haut















