Page 1 sur 1
Détecter facilement une page cloakée
#1
Posté 03 mars 2007 - 03:43
Salut,
Juste un petit commentaire par rapport à ceux qui cherchent le moyen de vérifier si une page Web est cloakée (trafiquée pour les moteurs de recherche)
La plupart du temps, vous allez bien sûr faire afficher la page en cache dans les résultats de Google.
Mais que faire si la page en question utilise la balise noarchive ?
D'ailleurs cela a servi de jeu sur Actulab: Le cloaking Cracking Challenge.
Prouver que cette page est cloakée:
http://www.actulab.c...g-challenge.php
Une méthode très simple que vous connaissez peut être déjà consiste à faire de l'IP spoofing (usurpation d'IP) en utilisant l'IP de GoogleBot.
Pour se faire, utilisez votre compte Google Analytics puis sélectionnez la fonction Synthèse Donnée/Site (en ayant préalablement créer le profil url du site à examiner)
Voici ainsi comment afficher instantément la page cloakée du concours d'Actulab:
http://arnoweb.free....ck_cloaking.jpg
Intéressant pour coincer facilement les tricheurs sans pour autant avoir de compétences techniques...
Juste un petit commentaire par rapport à ceux qui cherchent le moyen de vérifier si une page Web est cloakée (trafiquée pour les moteurs de recherche)
La plupart du temps, vous allez bien sûr faire afficher la page en cache dans les résultats de Google.
Mais que faire si la page en question utilise la balise noarchive ?
D'ailleurs cela a servi de jeu sur Actulab: Le cloaking Cracking Challenge.
Prouver que cette page est cloakée:
http://www.actulab.c...g-challenge.php
Une méthode très simple que vous connaissez peut être déjà consiste à faire de l'IP spoofing (usurpation d'IP) en utilisant l'IP de GoogleBot.
Pour se faire, utilisez votre compte Google Analytics puis sélectionnez la fonction Synthèse Donnée/Site (en ayant préalablement créer le profil url du site à examiner)
Voici ainsi comment afficher instantément la page cloakée du concours d'Actulab:
http://arnoweb.free....ck_cloaking.jpg
Intéressant pour coincer facilement les tricheurs sans pour autant avoir de compétences techniques...
#2
Posté 03 mars 2007 - 09:31
Tiens, c'est interessant ça !
"Les opportunités sont souvent cachées derrière un dur labeur. C'est pourquoi peu de gens les reconnaissent." Ann Landers
Recruteo.com : offres d'emploi webmarketing et référencement
Répertoire BtoB, l'annuaire des entreprises BtoB
wabstemer
Recruteo.com : offres d'emploi webmarketing et référencement
Répertoire BtoB, l'annuaire des entreprises BtoB
wabstemer
#3
Posté 03 mars 2007 - 13:31
Un autre moyen qui ne nécessite pas une inscription à un quelconque service (mais moins fiable on va le voir) est d'installer l'addon "user agent switcher" de firefox.
Ajoutez le user agent de googlebot ( Googlebot/2.1 (+http://www.google.com/bot.html) par exemple ).
Il vous suffit alors sur la page en question de basculer entre votre user agent et celui de googlebot pour détecter le cloaking.
Jan étant un petit peu vicieux a fait du cloaking sur ip et nous délivre donc le message suivant :
Avoir recours au cloaking n'est que la traduction d'un site non pertinent, sans contenu enrichi, sans maillage qualifié. Si c'est le cas de votre concurrent, frottez vous les mains, vous lui passerez devant...
Merci Arno pour la ressource...
Ajoutez le user agent de googlebot ( Googlebot/2.1 (+http://www.google.com/bot.html) par exemple ).
Il vous suffit alors sur la page en question de basculer entre votre user agent et celui de googlebot pour détecter le cloaking.
Jan étant un petit peu vicieux a fait du cloaking sur ip et nous délivre donc le message suivant :
Citation
Désolé! Vous n'avez pas cracké notre cloaking. La page que vous visualisez n'est qu'une version réservée à ceux qui, comme vous, tentent (grossièrement) de se faire passer pour GoogleBot. Ce n'est pas la page que nous présentons au VRAI GoogleBot. Eh oui, nous cloakons sur l'IP. Ceci dit vous êtes en bonne voie, essayez encore 
Avoir recours au cloaking n'est que la traduction d'un site non pertinent, sans contenu enrichi, sans maillage qualifié. Si c'est le cas de votre concurrent, frottez vous les mains, vous lui passerez devant...
Merci Arno pour la ressource...
#4
Posté 03 mars 2007 - 13:43
Bravo arnoweb2! Il va falloir améliorer les scripts de cloaking pour corriger cette faille via analytic 
rico, il y a au moins une autre bonne raison d'utiliser le cloaking: éviter de se faire voler son contenu. Le "duplicate content" peut faire des ravages sur le référencement d'un site. Et les "scrappers" sont légion ces temps-ci
rico, il y a au moins une autre bonne raison d'utiliser le cloaking: éviter de se faire voler son contenu. Le "duplicate content" peut faire des ravages sur le référencement d'un site. Et les "scrappers" sont légion ces temps-ci
#5
Posté 03 mars 2007 - 18:44
#6
Posté 03 mars 2007 - 18:55
A priori rien ne permet de distinguer Analytics d'un vrai crawl de Googlebot (même user agent, même IP).
Je ne vois pas de solution pour l'instant... mais je cherche
Je ne vois pas de solution pour l'instant... mais je cherche
#8
Posté 04 mars 2007 - 07:14
Au sujet du cloaking, Matt Cutts vient de publier un billet (03/03/07) : A quick word about cloaking.
Et Jan expose sa parade actuelle dans un billet "La mort du cloaking" sur son blog, je cite :
Et Jan expose sa parade actuelle dans un billet "La mort du cloaking" sur son blog, je cite :
Citation
La seule pseudo-parade que j'ai trouvée pour tenter de cacher une page cloakée aux utilisateurs d'Analytics consiste à faire une redirection en javascript si la page est emprisonnée dans une frame. Mais ça reste du javascript...
#9
Posté 05 mars 2007 - 07:38
Pour tester la technique décrite par arnoweb2
, Jan a mis en place une page cloakée à cette URL : -www.isabloodycloaker.com/analytics.php
La page vue par l'internaute débute par ceci : "Page for humans. User Agent: (...)" et celle lue par le spider par cela : "Page exclusively for Googlebot! User Agent:(...)"
La page vue par l'internaute débute par ceci : "Page for humans. User Agent: (...)" et celle lue par le spider par cela : "Page exclusively for Googlebot! User Agent:(...)"
#10
Posté 06 mars 2007 - 20:08
Citation
Avoir recours au cloaking n'est que la traduction d'un site non pertinent, sans contenu enrichi, sans maillage qualifié. Si c'est le cas de votre concurrent, frottez vous les mains, vous lui passerez devant
GG notre meilleurs ami a vraiment progresser je trouve dans ce domaine. Dans mes requetes concurrentielles, de nombreux sites utilisants le cloacking ont diaparus, pareil pour les pages satellites. Même les sites utilisants massivement les balises noscript etc ... ont bien reculés.
Cependant, il devient de plus en plus rare de voir des sites très explicites avec un faible nombre de pages placé en tête de résultats si de gros busdozers, même plus généralistes, tapent sur les mêmes requêtes.
-----------------------------------------
-----------------------------------------
#11
Posté 09 mars 2007 - 20:06
rico, le samedi 3 mars 2007, 13h31, dit :
user agent switcher[/url]" de firefox.
Ajoutez le user agent de googlebot ( Googlebot/2.1 (+http://www.google.com/bot.html) par exemple ).
Il vous suffit alors sur la page en question de basculer entre votre user agent et celui de googlebot pour détecter le cloaking
Ajoutez le user agent de googlebot ( Googlebot/2.1 (+http://www.google.com/bot.html) par exemple ).
Il vous suffit alors sur la page en question de basculer entre votre user agent et celui de googlebot pour détecter le cloaking
#12
Posté 16 septembre 2007 - 22:32
Bonsoir,
L'utilisation de google analytics est-elle toujours d'actualité car je n'arrive pas à reproduire la procédure décrite.
L'utilisation de google analytics est-elle toujours d'actualité car je n'arrive pas à reproduire la procédure décrite.
Recettes de cocktails célèbres : mojito, pina colada, margarita, tequila sunrise...
Changer de look avec l'aide d'une agence de relooking
Changer de look avec l'aide d'une agence de relooking
#13
Posté 16 septembre 2007 - 22:43
Non ça ne marche plus depuis quelques temps.
- ← Comment automatiser les liens sur mes sites depuis une seule page
- Techniques de Référencement
- Farm link or not →
Partager ce sujet :
Page 1 sur 1



Haut












