Aller au contenu

Referer spam


Sebastien

Sujets conseillés

J'ai un spammeur qui n'arrete pas de crawler mon site dans l'espoir (vain) de creer des backlinks via de faux referers (urls du type www.personal-loan-ebanking.info). Le probleme est que le domaine et l'ip sont a chaque fois différents... Les urls sont toujours du type "motclé-motclé.info" et c'est bien le meme spammeur car son systeme est toujours le meme : windows server 2003 et explorer 6.

Il fausse completement mes stats...

Il y a un moyen de le bloquer?

Lien vers le commentaire
Partager sur d’autres sites

Sebastien,

A défaut d'UR, tu peux tester l'user agent ($_SERVER["HTTP_USER_AGENT"]) et le referer ($_SERVER["HTTP_REFERER"]) en PHP... et ainsi envoyer l'importun au diable ;)

Lien vers le commentaire
Partager sur d’autres sites

Le referer change tout le temps et je n'ai pas d'user agent specifique (IE6)

Voici quelques visites :

Windows Server 2003 Explorer 6.0 ? 194.213.41.14

Language:  English (United States)

Referer:  -http://www.dating-site-e-site.info

Time Viewed pages [1]

15:59:22 /dotclear/?photoblog/2004/08/11

Windows Server 2003 Explorer 6.0 ? 211.24.161.11

Language:  English (United States)

Referer:  -http://www.rental-car-e-site.info

Time Viewed pages [1]

15:55:39 /dotclear/?2004/09/29

Windows Server 2003 Explorer 6.0 ? 80.65.102.162

Language:  English (United States)

Host:  ip102-162.introweb.nl

Referer:  -http://www.adult-dvd-top-shop.info

Time Viewed pages [2]

14:15:20 /dotclear/?2004/07

14:50:27 /dotclear/?musique/2004/10/24

Windows Server 2003 Explorer 6.0 ? 194.213.41.11

Language:  English (United States)

Referer:  -http://www.digital-cameras-esite.info

Time Viewed pages [1]

13:41:05 /dotclear/?photoblog

Windows Server 2003 Explorer 6.0 ? 213.56.68.29

Language:  English (United States)

Referer:  -http://www.personal-loan-ebanking.info

Time Viewed pages [1]

12:06:20 /dotclear/?bouddhisme/2004/09/07

Windows Server 2003 Explorer 6.0 ? 195.95.17.245

Language:  English (United States)

Host:  195-95-17-245.KPNBelgium.be

Referer:  -http://www.mortgage-4-u.info

Time Viewed pages [1]

10:56:47 /dotclear/?general/2004/10/08

Je suppose qu'en testant la positivité de ces 3 critères (windows server 2003, ie 6, referer en .info) je pourrais bloquer ce robot mais je ne sais pas du tout programmer :(

Et on peut bloquer tous les referers .info par le htaccess?

Lien vers le commentaire
Partager sur d’autres sites

Hum, bloquer tous les referers en .info ne me semble pas une bonne idée: tu vas te priver de "vrais" BLs et de "vrais" visiteurs.

Le seul point commun de tous ces referers semble être l'user agent et le referer en .info. Tu es sur qu'il s'agit d'un spameur de stats?

Lien vers le commentaire
Partager sur d’autres sites

Tu es sur qu'il s'agit d'un spameur de stats?

Je ne vois pas ce que ca pourrait etre d'autre, il n'a pas de liens vers moi, et quand on voir les noms de domaines on voit bien qu'il s'agit de themes hyper concurrentiels. En plus les sites ne sont même pas actifs ...

Lien vers le commentaire
Partager sur d’autres sites

Essayer de créer des backlinks vers des sites qui n'existent pas? Il sont curieux ces spameurs :wacko:

Si tu décides de les bloquer, il faut utiliser le critère suivant:

- présence de ".info" dans le referer

ET

- user agent adéquat.

Lien vers le commentaire
Partager sur d’autres sites

Slt Sebastien,

Peux-tu m'expliquer ce que tu entends par

creer des backlinks via de faux referers
?

Je ne comprends pas bien le problème ?

Lien vers le commentaire
Partager sur d’autres sites

Certains sites laissent leurs stats publiques. Donc des petit malins créent des robots avec un faux referers faisant croire que quelqu'un est venu via ce faux referers. Le lien s'affiche dans les stats et ca fait un backlink supplementaire...

Lien vers le commentaire
Partager sur d’autres sites

OK compris !

La solution ne consisterait-elle pas à mettre un .htaccess et un .htpasswd pour limiter l'accès aux stats, quitte a indiquer le login et le mot de passe à tout le monde si vraiment c'est vraiment public, mais dans ce cas le moteur de recherche ne passera pas, et pas de BL :P

Lien vers le commentaire
Partager sur d’autres sites

Certains sites laissent leurs stats publiques. Donc des petit malins créent des robots avec un faux referers faisant croire que quelqu'un est venu via ce faux referers. Le lien s'affiche dans les stats et ca fait un backlink supplementaire...

Je pense que c'est aussi pour avoir des visiteurs webmasters (sans ciblage sur eux pour autant), vu à quelles échelles c'est.

Lien vers le commentaire
Partager sur d’autres sites

Salut,

En faisant une recherche WHOIS des différents domaines que tu as listé, on peut constater qu'ils ne sont pas identiques, vu que les adresses (toutes aux USA, probablement fictives) sont différentes à chaque fois. En revanche, il y a quelques points communs:

- L'email de contact est toujours un truc du style "contact{chiffre}@marketing-support.info".

- Les name servers sont FULL1.GANDI.NET et FULL2.GANDI.NET.

- Bien sûr tous enregistrés le même jour (01-Nov-2004).

- Tous le même status "CLIENT LOCK".

et quelquechose dont je ne sais pas trop de quoi il s'agit, le même Sponsoring Registrar: R245-LRMS.

Bien sûr, le site -http://www.marketing-support.info ne donne rien, mais il y a peut-être quelque chose à faire avec ces détails-là. Si quelqu'un a une idée pour aider l'ami Sebastien avec ça. Evidemment, rien à faire d'un point de vue htaccess, mais il y a peut-être moyen de les contacter, les menacer ou leur "nuire" (retour d'ascenseur j'entend).

Sinon, effectivement, dans le cas échéant, si c'est trop hard, la solution d'Adn est pas mal. Tu bloques l'accès publique de tes stats avec un login et un mot de passe que tu inscrits en évidence pour que tout le monde, sauf les robots, puisse les voir.

Bonne chance toujours. ++

Lien vers le commentaire
Partager sur d’autres sites

OK compris !

La solution ne consisterait-elle pas à mettre un .htaccess et un .htpasswd pour limiter l'accès aux stats, quitte a indiquer le login et le mot de passe à tout le monde si vraiment c'est vraiment public, mais dans ce cas le moteur de recherche ne passera pas, et pas de BL  :P

<{POST_SNAPBACK}>

Cette solution est souvent reprise lorsque l'on met des programmes en libre accès. Pour éviter certains abus, on met tout de même un formulaire, de sorte que les robots ne puissent pas passer par exemple, en laissant en face de chaque champ les login/mot de passe pour que tout un chacun puisse s'inscrire/s'identifier.

Anonymus.

Lien vers le commentaire
Partager sur d’autres sites

Ce spammeur represente plus de 7% des hits de mon blog :(

Y aurait il une ame charitable pour m'indiquer un script php qui denie l'accès si à la fois le referer est un domaine en .info et que l'OS est Windows Server 2003? ou je mets ce script?

Lien vers le commentaire
Partager sur d’autres sites

Ca devrait donner quelque chose comme :

if (preg_match("/Windows Server 2003 Explorer 6.0/",@$_SERVER['HTTP_USER_AGENT']) && (substr(@$_SERVER['HTTP_REFERER'],-4)=="info"))
die("Sorry, no access now..");

Où d'un coté on teste qu'il y ait bien la chaine windows server 2003

et d'un autre coté, que le referer se termine par info.

Anonymus.

Lien vers le commentaire
Partager sur d’autres sites

Il faut que cela apparaisse sur toutes les pages concernées.

Si tu as un fichier de configuration (ce qui est souvent le cas), par exemple celui qui contient les mots de passe mysql, alors tu peux le mettre là. Sinon, si tu as un fichier type 'header', tu peux le mettre dedans aussi.

Sinon, si tu n'as pas de fichier appelé par toutes les pages, alors oui, il faut le mettre sur toutes tes pages... Mais :

Profites de l'occasion que tu as d'ouvrir toutes tes pages pour te créer un ficheir include, où tu placeras ce code, puis éventuellement plus tard d'autres code qui concernent toutes ces pages.

Ce qu'il fait ? Il renvoie une page où il est écrit : Sorry, no access. C'ets une page normale, sauf qu'elle est (presque) vide.

A supposer que ce soit un 'aspirateur de site', il va vite se rendre compte que toutes ses pages sont blanches ;)

Lien vers le commentaire
Partager sur d’autres sites

Si je le mets dans le template de mon blog, seul ton script sera executé? Ou bien egalement mon include de statistiques en bas de page ?

Comment lui retourner une erreur 403, peut etre plus radicale?

(dis le si j'abuse de ton temps surtout )

Lien vers le commentaire
Partager sur d’autres sites

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...