Aller au contenu

htaccess, PDF et referer


Sujets conseillés

Bonjour,

Situation :

Sur mon site, j'ai une page html à partir de laquelle les visiteurs peuvent télécharger des fichiers pdf. Cette page html et les pdf sont dans un répertoire.

Les moteurs référencent ces fichiers pdf et les internautes ont donc la possibilité de télécharger, ou voir, ces pdf directement à partir des résultats de recherches sans passer par mon site et donc la page html.

J'ai voulu remédier à cela par une redirection (réecriture d'url) dans mon htaccess* afin que les clics dans les résultats des moteurs dirigent vers la page html pour télécharger à partir de la page et non directement depuis les moteurs.

J'y suis arrivé, mais le problème se pose pour mes statistiques, faussées du coup ! En effet, quand je regarde les pages d'entrée par exemple, au lieu de voir ma page html (puisque c'est une redirection), ce sont les fichiers pdf qui figurent !

Question :

Comment remédier à cela ?

Par avance, je vous remercie.

*

RewriteEngine On

RewriteCond %{HTTP_REFERER} !^$

RewriteCond %{HTTP_REFERER} !^http://(www\.)?MONSITE.com/.*$ [NC]

RewriteRule \.(pdf|PDF)$ /DOCPDF/ [NC,L]

Modifié par Phoenix13
Lien vers le commentaire
Partager sur d’autres sites

Tu ne pourras pas, sauf si tu interdis aux moteurs d'indexer les documents.

Un appel à *.pdf reste un appel à ce fichier, et non à la page de redirection. Et tes stats le montrent bien.

En changeant ta réécriture et renvoyant une entête 301, tu auras effectivement les deux dans les stats, mais les moteurs désindexeront tes documents (voir ci-dessus ;) )

Lien vers le commentaire
Partager sur d’autres sites

J'y suis arrivé, mais le problème se pose pour mes statistiques, faussées du coup ! En effet, quand je regarde les pages d'entrée par exemple, au lieu de voir ma page html (puisque c'est une redirection), ce sont les fichiers pdf qui figurent !
Les statistiques sont changées, mais elles ne sont pas vraiment "faussées". Elles reflètent la réalité.

A première vue, je ne pense pas que tu perdes aucune information statistique à cause de cette redirection; au contraire, tu peux ainsi distinguer ceux qui arrivent sur ta page html directement de ceux qui y arrivent via les pdf et les moteurs.

Jean-Luc

Lien vers le commentaire
Partager sur d’autres sites

Sans vouloir jouer sur les mots, quand un visiteur d'un moteur demande un .pdf, il voir bien .pdf dans la barre d'adresse quand s'affiche le contenu interne de /DOCPDF/.

Quoi qu'il en soit, comme l'a dit Dan, le moyen de contourner ce problème est de passer par une vraie redirection (301) plutôt que par une réécriture d'URL sans redirection. Je ne pense pas qu'il y ait un risque réel de désindexation des PDF dans la mesure où les moteurs ne présenteront jamais un referrer venant d'un moteur de recherche.

Jean-Luc

Lien vers le commentaire
Partager sur d’autres sites

Je ne pense pas qu'il y ait un risque réel de désindexation des PDF dans la mesure où les moteurs ne présenteront jamais un referrer venant d'un moteur de recherche.

C'est très vrai... j'avais oublié que la redirection était conditionnelle.

Lien vers le commentaire
Partager sur d’autres sites

Je ne pense pas qu'il y ait un risque réel de désindexation des PDF dans la mesure où les moteurs ne présenteront jamais un referrer venant d'un moteur de recherche.

Je ne comprends pas bien... Tu peux m'expliquer stp ?

Quoi qu'il en soit, comme l'a dit Dan, le moyen de contourner ce problème est de passer par une vraie redirection (301) plutôt que par une réécriture d'URL sans redirection.

Ok, et dans les stats, on y verrai quoi dans ce cas ?

Note : Et ça donnerai quoi avec une redirection 302 voire 307 ?

Merci.

Lien vers le commentaire
Partager sur d’autres sites

Si ce sont des stats basées sur des marqueurs JavaScript (Google Analytics), il n'y aura pas de trace des redirections dans les stats.

Si ce sont des stats basées sur les logs (AWStats), tu verras les redirections seulement quand tu examineras la liste des URL qui ont renvoyé un code 301 ou 302.

Dans les deux cas, les referrers des visiteurs provenant des moteurs de recherche devraient apparaître pour /DOCPDF/ comme tu le souhaites.

Jean-Luc

Lien vers le commentaire
Partager sur d’autres sites

Pour les stats, j'utilise Google Analytics et XiTi Pro.

J'ai fait un test hier avec une redirection 302 et 301

302

RewriteRule \.(pdf|PDF)$ /DOCPDF/ [NC,R,L]

301

RewriteRule \.(pdf|PDF)$ /DOCPDF/ [NC,R=301,L]

Que ce soit avec une 301 ou 302, les résultats me surprennent en regardant mes stats dans Analytics (pas testé avec Xiti Pro)...

Le protocole était le suivant : chercher via un mot-clé un pdf de /DOCPDF/ dans Google, même chose dans Yahoo et cliquer sur le lien. Faire cette manip. 3 fois de suite.

En théorie, mes stats devraient indiquer, entre autre, le referer (Google et Yahoo), le nombre de visites (3 pour Google et 3 pour Yahoo), en page d'entrée /DOCPDF/ et le mot-clé tapé dans Google et Yahoo.

En réalité, lorsque je regarde les résultats des tests dans Analytics, je vois le referer (Google, Yahoo), pour le nombre de visites j'ai ZERO (toute la ligne indique zéro de bout en bout), en page d'entrée... ZERO et concernant les mots-clés pour Google et Yahoo, ils figurent bien mais avec ZERO sur toute la ligne.

En un mot, TOUT est à zéro. Ce n'est pas comme si il n'y avait rien, non non... C'est bien indiqué 0 !

J'espère être clair ?

C'est curieux tout ça, non ?

Lien vers le commentaire
Partager sur d’autres sites

Je ne pense pas qu'il y ait un risque réel de désindexation des PDF dans la mesure où les moteurs ne présenteront jamais un referrer venant d'un moteur de recherche.

Je viens seulement de comprendre ce que tu voulais dire ;-)

Bon... J'ai la conclusion de mes nouveaux tests suite aux curieux résultats récents. En fait Google Analytics devait avoir "du plomb dans l'aile", car -effectivement- en spécifiant une redirection, que ce soit 301, 302 ou 307, au lieu d'une simple réecriture, le problème se règle.

Jeanluc, Dan, un grand merci ;)

Lien vers le commentaire
Partager sur d’autres sites

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...