Jump to content
Sign in to follow this  
bed

Script anti aspirateur

Rate this topic

Recommended Posts

Bonjour,

J'en ai marre de me faire pomper mes sites et de voir des miroirs avec des adsense dessus (même les entreprises s'y mettent...), je recherche un script anti-aspirateur, j'ai bien trouvé celui-ci qui me semble pas mal :

http://www.toulouse-renaissance.net/c_outi...de_htaccess.htm

Mais j'aurais aimé avoir vos avis sur la questions, quels sont vos retours d'expériences la dessus ?

Merci

Share this post


Link to post
Share on other sites

salut,

c'est un script qui marche.

Personnellement j'utilise celui-ci

SetEnvIfNoCase User-Agent "psycheclone" bad_bot
SetEnvIfNoCase User-Agent "SurveyBot/2.3" bad_bot
SetEnvIfNoCase User-Agent "ia_archiver" bad_bot
SetEnvIfNoCase User-Agent "SBIder/0.8-dev" bad_bot
SetEnvIfNoCase User-Agent "aipbot/1.0" bad_bot
SetEnvIfNoCase User-Agent "larbin_2.6.3" bad_bot
Deny from env=bad_bot

dans lequel je n'ai mis que les aspirateurs qui passaient sur mon site et que j'avais détecté dans mes logs.

slender

Share this post


Link to post
Share on other sites

Tu as un 'anti aspirateur' universel, ici :

http://www.webmaster-hub.com/publication/article49.html

Le problème des aspirateurs est qu'ils pompent le site, l'autre problème est qu'ils pompent les ressources, en récupérant un grand nombre de pages, en très peu de temps. Ce script permet d'y faire face. ;)

Share this post


Link to post
Share on other sites

On bloque pas les bots des moteurs de recherche avec ce système ?

Share this post


Link to post
Share on other sites

Salut

Le site Toulouse Renaissance a une des meilleures listes que je connaisse: à utiliser sans modération :)

Slender: ia_archiver n'est pas du tout un aspirateur néfaste, c'est le robot du site archive.org et même si ce n'est pas très utile de savoir à quoi ressemblait son site en 1999, leur robot est respectueux du protocole robots.txt et ne pompe pas de la bande passante à tire-larigot.

Après, c'est toi qui voit ..

SurveyBot c'est idem, c'est le robot de whois.sc (devenu domaintools.com) et jamais eu de problèmes avec ce bot non plus

Ces deux-là ne sont AMA pas à classer dans les "bad bots" ;)

Share this post


Link to post
Share on other sites
Ces deux-là ne sont AMA pas à classer dans les "bad bots" ;)

ok je corrige, merci d'avoir remarqué cela... ;)

slender

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
Sign in to follow this  

×
×
  • Create New...