Détecter facilement une page cloakée
#1
Posté 03 mars 2007 - 03:43
Juste un petit commentaire par rapport à ceux qui cherchent le moyen de vérifier si une page Web est cloakée (trafiquée pour les moteurs de recherche)
La plupart du temps, vous allez bien sûr faire afficher la page en cache dans les résultats de Google.
Mais que faire si la page en question utilise la balise noarchive ?
D'ailleurs cela a servi de jeu sur Actulab: Le cloaking Cracking Challenge.
Prouver que cette page est cloakée:
http://www.actulab.c...g-challenge.php
Une méthode très simple que vous connaissez peut être déjà consiste à faire de l'IP spoofing (usurpation d'IP) en utilisant l'IP de GoogleBot.
Pour se faire, utilisez votre compte Google Analytics puis sélectionnez la fonction Synthèse Donnée/Site (en ayant préalablement créer le profil url du site à examiner)
Voici ainsi comment afficher instantément la page cloakée du concours d'Actulab:
http://arnoweb.free....ck_cloaking.jpg
Intéressant pour coincer facilement les tricheurs sans pour autant avoir de compétences techniques...
#2
Posté 03 mars 2007 - 09:31
Recruteo.com : offres d'emploi webmarketing et référencement
Répertoire BtoB, l'annuaire des entreprises BtoB
Les conseils pratiques d'Acturama
#3
Posté 03 mars 2007 - 13:31
Ajoutez le user agent de googlebot ( Googlebot/2.1 (+http://www.google.com/bot.html) par exemple ).
Il vous suffit alors sur la page en question de basculer entre votre user agent et celui de googlebot pour détecter le cloaking.
Jan étant un petit peu vicieux a fait du cloaking sur ip et nous délivre donc le message suivant :
Citation
Avoir recours au cloaking n'est que la traduction d'un site non pertinent, sans contenu enrichi, sans maillage qualifié. Si c'est le cas de votre concurrent, frottez vous les mains, vous lui passerez devant...
Merci Arno pour la ressource...
#4
Posté 03 mars 2007 - 13:43
rico, il y a au moins une autre bonne raison d'utiliser le cloaking: éviter de se faire voler son contenu. Le "duplicate content" peut faire des ravages sur le référencement d'un site. Et les "scrappers" sont légion ces temps-ci
#5
Posté 03 mars 2007 - 18:44
Jan, le samedi 3 mars 2007, 13h43, a dit :
Salut Jan,
Tu comptes améliorer le script de quelle manière ?
Filtrage sur user-agent de Google Analytics ou sur l'IP utilisée par Google Analytics ?
#6
Posté 03 mars 2007 - 18:55
Je ne vois pas de solution pour l'instant... mais je cherche
#8
Posté 04 mars 2007 - 07:14
Et Jan expose sa parade actuelle dans un billet "La mort du cloaking" sur son blog, je cite :
Citation
#9
Posté 05 mars 2007 - 07:38
La page vue par l'internaute débute par ceci : "Page for humans. User Agent: (...)" et celle lue par le spider par cela : "Page exclusively for Googlebot! User Agent:(...)"
#10
Posté 06 mars 2007 - 20:08
Citation
GG notre meilleurs ami a vraiment progresser je trouve dans ce domaine. Dans mes requetes concurrentielles, de nombreux sites utilisants le cloacking ont diaparus, pareil pour les pages satellites. Même les sites utilisants massivement les balises noscript etc ... ont bien reculés.
Cependant, il devient de plus en plus rare de voir des sites très explicites avec un faible nombre de pages placé en tête de résultats si de gros busdozers, même plus généralistes, tapent sur les mêmes requêtes.
-----------------------------------------
-----------------------------------------
#11
Posté 09 mars 2007 - 20:06
rico, le samedi 3 mars 2007, 13h31, a dit :
Ajoutez le user agent de googlebot ( Googlebot/2.1 (+http://www.google.com/bot.html) par exemple ).
Il vous suffit alors sur la page en question de basculer entre votre user agent et celui de googlebot pour détecter le cloaking
#12
Posté 16 septembre 2007 - 22:32
L'utilisation de google analytics est-elle toujours d'actualité car je n'arrive pas à reproduire la procédure décrite.
Changer de look avec l'aide d'une agence de relooking
#13
Posté 16 septembre 2007 - 22:43

Connexion
Inscription
Aide


Haut
Citer




