Aller au contenu

Synthèse géographique: différence entre webalizer et Analytics


ensemblevide

Sujets conseillés

Bonjour,

J'utilise ces deux outils pour suivre les stats de mon site.

J'ai pu me faire une idée précise concernant la fiabilité de l'un et l'autre sur les visites (voir ici ou )

Mais je me demande ce qui provoque des différences aussi importantes sur la provenance des visiteurs (Synthèse géographique ou Usage by countries)

GG Analytics donne par exemple 51% de visites venant de France alors que Webalizer indique 28%. Que signifie dans Webalizer «Unresolved/Unknown» et «Network» ?

Pourquoi ces différences ? Qui est le plus fiable sur la partie provenance géographique ? Est ce que tous les deux se basent sur les adresse IP et la géolocalisation des visiteurs ?

Merci d'avance

Philippe

Lien vers le commentaire
Partager sur d’autres sites

Salut

Déjà comparer deux systèmes non-comparables, c'est une drôle d'idée.

Analytics est un marqueur Javascript externe. Et Webalizer est un analyseur de logs.

Donc déjà, d'office, ils ne te fourniront pas les mêmes données.

Sinon, «Unresolved/Unknown» ou «Network» correspondent souvent à une IP sur laquelle il n'est pas possible de faire un reverse DNS.

Typiquement: une IP d'entreprise, quand des visiteurs viennent sur ton site depuis l'ordinateur de leur bureau.

Ensuite, un reverse DNS en et «.....wanadoo.fr» (Orange) sera forcément comptabilisé comme une visite française, à cause du TLD .fr

Alors que et «.....gaoland.net» (Neuf Télécom) ne le sera pas forcément, ça dépend des outils de stats: certains font une liste des FAIs par pays (plus lourd mais plus précis), certains ne se fient qu'au TLD.

Lien vers le commentaire
Partager sur d’autres sites

Bonjour Dudu

Merci pour ta réponse.

Je suis bien d'accord avec toi, les deux outils sont très différents, mais à ce que j'ai lu GG Analytics semblerait plus près de la réalité (?!) Voir les liens que j'ai mis dans mon post initial.

Ma question était motivée par une étude que je fais afin de démontrer les avantages et défauts de chacun à propos des stats de mon site. Lors du lancement du site on n'utilisait que Webalizer. Les résultats étaient encourageants. Et n'étaient pas contestés. Deux ans après j'ai installé Analytics. Ce qui a provoqué un choc ! Normal, tellement il y avait de différence en terme de visites et pages vues !

Maintenant j'ai compris la spécificité de chacun des deux outils.

Mais concernant la provenance des visiteurs ça n'était pas clair pour moi.

J'ai pas bien compris ce qu'est un reverse DNS. Peux tu m'en dire plus ?

Donc si je comprends bien, Webalizer se base sur les domaines ? Si un domaine est en .com, il considérera la visite venant des Etats Unis ? Et Google Analytics, sur quoi se base t'il pour définir la provenance des visites ?

Pour les stats de mon site, Webalizer annonce 35% de Network et 12% Unresolved/Unknown. Soit 47% de visites non déterminées du point de vue géographique. Cela fait beaucoup tout de même. Du coup c'est normal que Webalizer donne un % inférieur de visites venant de France que GG. Comme mon site est en trois langues, ces différences sont très troublantes et amènent à des conclusions fausses. Je voudrais donc pouvoir faire des analyses plus fines et exactes sur la provenance des visites de mon site.

Ce qui m'amène à croire qu'Analytics doit être plus proche de la réalité tout de même en terme de provenance des visites (?!)

Philippe

Lien vers le commentaire
Partager sur d’autres sites

à ce que j'ai lu GG Analytics semblerait plus près de la réalité (?!) Voir les liens que j'ai mis dans mon post initial.
Je les ai lus, et je pense justement .. l'inverse.

Pour moi, un analyseur de logs est forcément plus proche de la réalité.

Bref, c'est un débat sans fin, il y a les aficionados des deux.

Normal, tellement il y avait de différence en terme de visites et pages vues !
Ça dépend comment est configuré Webalizer.

Prend-il en compte les visites des robots (notamment ceux de moteurs de recherche) ? Vu qu'Analytics ne les compatibilise pas comme visiteurs, ça crée des écarts énormes.

Analytics ne prend pas non plus en compte les visiteurs qui désactivent JS (c'est mon cas) alors que Webalizer si. Certes, les sans-JS ne sont pas légion, mais c'est un coup à faire une différence sensible à hauteur de quelques pourcents.

J'ai pas bien compris ce qu'est un reverse DNS. Peux tu m'en dire plus ?
Très schématiquement, c'est une sorte d'IP bis mais qui n'est pas constituée que de chiffres. Il y figure forcément le nom de domaine à qui appartient l'IP.

Par exemple, tu as posté ce message avec une adresse IP qui se résoud en host.154.**.**.**.rev.coltfrance.com (j'ai masqué certains chiffres par confidentialité)

Certaines adresses IP ne peuvent pas être résolues: il n'y aura pas de reverse DNS. C'est vraisemblablement ce qui finit en «Unresolved/Unknown» dans tes stats.

Donc si je comprends bien, Webalizer se base sur les domaines ? Si un domaine est en .com, il considérera la visite venant des Etats Unis ? Et Google Analytics, sur quoi se base t'il pour définir la provenance des visites ?
Il me semble que Webalizer se base sur les domaines, oui. Ceci étant, ça fait longtemps que je ne l'ai pas utilisé.

Un domaine .com ne sera jamais considéré comme venant des États-Unis. Les États-Unis c'est .us

Les TLDs en deux lettres sont nationaux (.fr pour la France, .us pour les États-Unis, .dz pour l'Algérie, .pl pour la Pologne, etc.)

Les TLDs en 3 lettres et plus sont généraux (.com pour commercial, .org pour les organisations, etc.)

À lire dans les publications du Hub: Les noms de domaine et leurs extensions

Quant à savoir sur quoi Analytics se base, personne ne le sait à part les gars de chez Google ;)

Lien vers le commentaire
Partager sur d’autres sites

Bref, c'est un débat sans fin, il y a les aficionados des deux.

bon alors admettons que le débat soit sans fin :(

Par contre de nombreux messages qui parlent de Webalizer disent que, par exemple, "quelqu'un place une image de ton site sur le sien, chaque fois qu'elle est affichée par un visiteur, celui-ci est compté comme un visiteur sur ton site alors qu'il n'a rien vu de ton site. "

Ca peut être une explication de la différence entre Webalizer et Analytics à propos des visites.

Ça dépend comment est configuré Webalizer.

Prend-il en compte les visites des robots (notamment ceux de moteurs de recherche) ? Vu qu'Analytics ne les compatibilise pas comme visiteurs, ça crée des écarts énormes.

Merci de poser la question, j'étais en train de lister les « crawler », « spider » ou « bot » trouvé dans la partie « Top 50 of 18016 Total Sites » de février 2009 de Webalizer :

339 visites llf531098.crawl.yahoo.net (robot yahoo)

418 visites de crawl-66-249-71-45.googlebot.com (robot Google)

414 visites de crawl-66-249-71-47.googlebot.com (robot Google)

409 visites de crawl-66-249-71-46.googlebot.com (robot Google)

321 visites de crawl13.exabot.com (robot Exalead)

59 visites de tc-gw.exabot.com (robot Exalead)

26 visites de crawler6132.ask.com (robot de Ask)

...

sur les 50 1er sites listés il y a 26 robots !!!! En je ne connais pas les sites suivants...

Merci pour tes explications sur le revers DNS

Les TLDs en 3 lettres et plus sont généraux (.com pour commercial, .org pour les organisations, etc.)

oui et les .net

Ils sont comptabilisés où dans Webalizer ?

Que veut dire "US Commercial" dans "Total countries" de Webalizer. Les .com ne seraient ils pas comptés ici ?

J'ai trouvé une catégorie "Non-Profit Organization". Ce ne seraient pas des .org ?

Bref Webalizer est très troublant !

Quant à savoir sur quoi Analytics se base, personne ne le sait à part les gars de chez Google

hum

Je viens de trouver cette page

Peut être un début de piste ?

Lien vers le commentaire
Partager sur d’autres sites

Comme analyseur de log, il vaudrait mieux utiliser AWStats qui est beaucoup mieux tenu à jour que Webalizer. La page de démo du site Webalizer date de mai 1999. :whistling:

Le problème que tu évoques provient de la méthode utilisée par Webalizer pour géolocaliser. Webalizer se base sur des requêtes DNS et il suppose que toute adresse .fr vient de France, tout .be vient de Belgique, etc. C'est assez correct, sauf pour les .com, .net, .org qu'il considère tous comme américains alors qu'on en trouve partout. Comme les .com peuvent représenter une part non négligeable de tes visiteurs, cela fausse tout.

Avec AWStats, il y a d'excellents plugins gratuits de géolocalisation (database d'adresses IP avec leur localisation). Je suppose que la géolocalisation de GA fonctionne selon le même principe que AWStats. Dans ce cas-ci, Google Analytics est donc plus correct que Webalizer.

Jean-Luc

Lien vers le commentaire
Partager sur d’autres sites

Sur le lien donné par ensemblevide on a :

Google Analytics utilise les adresses IP des visiteurs pour déterminer leur origine géographique

Et on peut penser que la base d'IP de google est assez fiable puisqu'il arrive a relativement bien geolocaliser les pubs adwords

Lien vers le commentaire
Partager sur d’autres sites

la base d'IP de google est assez fiable
Ah.

Une anecdote au passage: Dan a été obligé il ya quelques mois de changer de serveur pour le Hub. Google considérait l'ancien serveur (dédié OVH hébergé en France) comme n'étant pas français.

Lien vers le commentaire
Partager sur d’autres sites

C'est bien pour ce type d'exceptions que je dis assez fiable.

Le truc c'est qu'aucuns système ne peux connaître comment un hebergeur ou FAI exploite les adresses IP qui lui ont été fournies. Normalement des séries de plages IP ont été attribuées aux différents pays mais avec tout le jeux des rachats certains FAI couvrent désormais plusieurs pays et quand ils sont en rupture de stock d'IP dans un pays ils ne se gênent pas pour attribuer celle d'un autre.

Pour le cas d'ovh, ce derniers disposes d'IP étrangères pour pouvoir geologaliser les domaines dans le pays ou l'on souhaite. OVH a donc probablement donne a Dan une mauvaise IP

Lien vers le commentaire
Partager sur d’autres sites

OVH m'avait bien donné une "bonne IP" ... vu que Maxmind montrait cette IP comme étant géolocalisée à Roubaix.

C'est la géolocalisation faite par Google qui est parfois fantaisiste :whistling:

Lien vers le commentaire
Partager sur d’autres sites

Bonjour

Merci à vous tous pour vos réponses très éclairantes.

Avant de continuer, je tiens apporter quelques précisions. Mon site est hébergé en mutualisé, et c'est donc mon hébergeur qui fournit Webalizer. La version actuellement est la 1.30 (elle date de 1999 !!!)

Comme analyseur de log, il vaudrait mieux utiliser AWStats qui est beaucoup mieux tenu à jour que Webalizer. La page de démo du site Webalizer date de mai 1999.

Du coup je ne pense pas que ça soit possible de pouvoir installer AWStats sur mon espace, je n'ai pas la main sur le serveur.

Le problème que tu évoques provient de la méthode utilisée par Webalizer pour géolocaliser. Webalizer se base sur des requêtes DNS et il suppose que toute adresse .fr vient de France, tout .be vient de Belgique, etc. C'est assez correct, sauf pour les .com, .net, .org qu'il considère tous comme américains alors qu'on en trouve partout. Comme les .com peuvent représenter une part non négligeable de tes visiteurs, cela fausse tout.

Merci pour la confirmation. Sur cette page il y a un graphique qui confirme :

Network c'est bien le .net, US Commercial, bien le .com. D'après mes recherches Webalizer, sur le version 2.0 affiche les correspondances. Faire une recherche sur GG avec "webalizer network", de nombreuses pages de stats de site avec webalizer sont listées.

C'est bien pour ce type d'exceptions que je dis assez fiable.

Il n'y a donc pas de solution parfaite; mais une mieux que l'autre ;)

Concernant toujours le sujet sur la provenance des visiteurs, comme Webalizer comptabilise les robots dans les visites (voir plus haut), pensez vous qu'il les compte aussi dans cette catégorie ? Un bot Google avec googlebot.com ça pourrait bien se retrouver dans "Us commercial" ??

Philippe

Lien vers le commentaire
Partager sur d’autres sites

OVH m'avait bien donné une "bonne IP" ... vu que Maxmind montrait cette IP comme étant géolocalisée à Roubaix.

C'est la géolocalisation faite par Google qui est parfois fantaisiste :whistling:

:P la base de Google ne devais pas être à jour alors, c'est tout de même curieux qu'ils aient une localisation d'IP fantaisiste vus qu'une bonne partie de leur activité s'appuie dessus.

Lien vers le commentaire
Partager sur d’autres sites

Du coup je ne pense pas que ça soit possible de pouvoir installer AWStats sur mon espace, je n'ai pas la main sur le serveur.
As tu accès aux fichiers logs ?

Si oui, et même si ton hébergeur ne t'autorise pas à installer AWStats sur ton serveur, il te reste toujours la possibilité d'installer AWStats en local et lui donner à analyser les fichiers logs que tu rapatrierais sur ton ordinateur.

C'est vrai que certains hébergeurs ont des analyseurs de logs un peu vieillots. Je me demande toujours pourquoi OVH, sur mutualisé, fournit Urchin vieille version. Ce pauvre Urchin est complètement dépassé et ne sert à rien.

Par curiosité, c'est qui ton hébergeur ?

Lien vers le commentaire
Partager sur d’autres sites

As tu accès aux fichiers logs ?

Comment le savoir ? Je ne sais pas. Mais il me semble ne pas avoir de grandes possibilités.

Par curiosité, c'est qui ton hébergeur ?

J'ai un basic (une vieille formule) chez Nfrance

Sinon pensez vous que les bots GG, Yahoo et co sont comptabilisés dans Webalizer, dans les provanances des visites, parmi "US Commercial" ?

Philippe

Lien vers le commentaire
Partager sur d’autres sites

Sinon pensez vous que les bots GG, Yahoo et co sont comptabilisés dans Webalizer, dans les provanances des visites, parmi "US Commercial" ?
Regarde s'il existe une section spécialement consacrée aux robots des moteurs. Si oui, ils ne sont pas inclus aux autres visiteurs.

Sinon (probablement le cas de ton Webalizer), alors c'est sûr qu'ils sont inclus dans les visiteurs, et donc dans "US Commercial". Tu les retrouveras probablement en cliquant sur "Agents", puis sur "View All User Agents": tu trouveras Googlebot, Slurp et les autres dans la liste avec un pourcentage de trafic. Peut-être que ces pourcentages t'aideront à clarifier les choses.

Jean-Luc

Lien vers le commentaire
Partager sur d’autres sites

Comment le savoir ? Je ne sais pas. Mais il me semble ne pas avoir de grandes possibilités.
Dans l'interface d'administration de ton compte NFrance, vois si tu trouves quelque chose de ressemblant. Sinon pose leur la question directement, tu seras fixé.

Je n'ai jamais utilisé leur service d'hebergement, donc je ne saurais pas te guider.

Sinon pensez vous que les bots GG, Yahoo et co sont comptabilisés dans Webalizer, dans les provanances des visites, parmi "US Commercial" ?
Yahoo! pas forcément, puisque leur robot s'identifie sous la forme ****.crawl.yahoo.net ;)
Lien vers le commentaire
Partager sur d’autres sites

Bonjour

Merci à tous pour votre participation. J'ai toutes mes réponses.

Certains d'entre-vous utilisent ils Webalizer ? En êtes vous satisfait ?

Sinon (probablement le cas de ton Webalizer), alors c'est sûr qu'ils sont inclus dans les visiteurs

Oui c'est mon cas, comme mentionné plus haut.

Dans l'interface d'administration de ton compte NFrance

j'ai rien trouvé. Tant pis.

Philippe

Lien vers le commentaire
Partager sur d’autres sites

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...