Jump to content

fichier robots.txt


sylvainz
 Share

Recommended Posts

Bonjour, je publie sur le site [marseille-sympa.com] des publicités Adsense de Google. Or ils viennent de m'écrire :

"Lors de l'examen de la mise en place de vos annonces, nous avons constaté que votre fichier robots.txt empêche actuellement notre robot d'exploration AdSense d'accéder à un nombre important de pages contenant des annonces dans votre compte.

Pour diffuser des annonces rémunérées et ciblées sur vos sites, notre robot d'exploration doit accéder aux pages de vos sites afin de déterminer leur contenu. Veuillez mettre à jour votre fichier robots.txt de sorte que le robot d'exploration AdSense puisse accéder à toutes les pages affichant des annonces Google. Pour ce faire, ajoutez le texte suivant dans votre fichier robots.txt :

User-agent: Mediapartners-Google*

Disallow:

Merci de nous aider à diffuser les annonces les plus pertinentes sur vos sites. Notez que, à l'avenir, si nous ne sommes pas en mesure d'explorer certaines de vos pages, nous pourrons être amenés à désactiver la diffusion d'annonces sur ces dernières."

____________________

pour info également, voici un ex de très nombreux blocages diagnostiqués sur l'interface adsense :

URL bloquée

http:/ / images. google. fr/ imgres? imgurl= http:/ / www. marseille-sympa. com/ rouget. jpg&imgrefurl= http:/ / www. marseille-sympa. com/ rouget. html&usg= __yd8FEK1iAmyz129HforzUNAUVUM= &h= 374&w= 940&sz= 65&hl= fr&start= 1&tbnid= LtHaEiMF2b4PeM:&tbnh= 59&tbnw= 148&prev= / images%3Fq%3Dpoisson%2Brouget%26gbv%3D2%26hl%3Dfr

Raison du blocage : Fichier Robots.txt

Dernière tentative d'exploration 4 déc. 2008

_________________________

Voici la question posée sur le forum d'aide de l'hébergeur :

J'ai créé ce fichier robots.txt et l'ai uploadé sur le site (au même niveau que les fichiers .html)

- Est-ce suffisant à votre avis (je n'avais pas auparavant créé de fichiers de ce type) ?

- Existe-t-il par défaut sur le serveur sur un niveau supérieur ?

Merci de votre attention, cordialement, SR

et la réponse :

Re: fichier robots.txtBonjour,

non il n'y a aucun fichier à la racine de nos serveurs qui empêcherait l'accès aux robots, ce n'est pas la politique d'nfrance

_______________________________

Donc, là je sèche... Peut-être avez-vous la solution à ce problème ?

par avance, merci, cordialement Sylvain

Link to comment
Share on other sites

On dirait que, chez Google, la main droite ne sait pas ce que fait la main gauche. :whistling:

Google AdSense t'envoie un message pour te dire que l'accès à la version de ta page mise en cache par Google Image est interdite d'accès par le fichier robots.txt [i]http://images.google.fr/robots.txt.

Tu oublies ce message sans intérêt ou tu envoies une copie à Google AdSense en leur expliquant que tu ne contrôles pas les fichiers robots.txt qu'ils mettent eux-mêmes sur leurs sites. ;)

Jean-Luc

Link to comment
Share on other sites

As-tu bien fait un copier/coller de l'URL ci dessus ?

Parce qu'elle contient plusieurs espaces qui n'ont pas leur place là !

oui, il s'agit bien d'un copier/collé - saufpour les 2 dernières phrases qui étaient en tableau et que j'ai déplacées

Link to comment
Share on other sites

On dirait que, chez Google, la main droite ne sait pas ce que fait la main gauche. :whistling:

Google AdSense t'envoie un message pour te dire que l'accès à la version de ta page mise en cache par Google Image est interdite d'accès par le fichier robots.txt [i]http://images.google.fr/robots.txt.

Tu oublies ce message sans intérêt ou tu envoies une copie à Google AdSense en leur expliquant que tu ne contrôles pas les fichiers robots.txt qu'ils mettent eux-mêmes sur leurs sites. ;)

Jean-Luc

Merci, ce problème ne semble pas venir de moi, j'avais jusqu'à présent ignoré ces problèmes d'URL bloquées affichés dans l'onglet "diagnostic du site" d'Adsense - je vais donc les contacter.

+ pour le cas où, quelqu'un est-il également victime de ce problème dans son interface Adsense ?

Link to comment
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
 Share

  • Similar Content

    • By fbern
      bonjour



      dans ses recommandations, Google préconise de bloquer grâce au robots.txt les publicités présentes sur son site.

      http://support.google.com/webmasters/bin/answer.py?hl=fr&answer=35769



      Quelle est la directive à utiliser pour lui bloquer les publicités Adsense ?



      d'autre part - et pardon si ma question est idiote - mais il y a des liens d'affiliation sur notre site- cela n'équivaut-il pas à des liens achetés ? comment se fait-il que google ne pénalise pas ces liens là (pure curiosité).



      Merci comme d'habitude aux professionnels seo de ce forum



      fbern

    • By Dan
      Webmaster Hub a le plaisir de mettre à disposition de ses membres une nouvelle rubrique Outils à dater de ce jour.

      Cette rubrique est amenée à se développer rapidement mais propose dès sa création quelques outils originaux, à savoir:
      Un visualisateur (ou vérificateur) d'entêtes HTTP permettant l'analyse détaillée des entêtes HTTP d'URLs (pages ou éléments de pages web). Sa particularité la plus intéressante est le suivi des redirections (limité à 8 pour éviter les boucles infinies) . Cet outil sera très utile à tous ceux qui utilisent des redirections ou réécritures d'URLs, en suivant les conseils donnés dans les articles du volet publications du Hub.
      Plus spécifiquement les articles: Le fichier .htaccess
      Mod_rewrite, ou la réécriture des URL "à la volée"
      La réécriture d'URL récursive

      [*]En partenariat avec Yooda, un formulaire de soumission automatique dans les moteurs et les annuaires qui fera gagner un temps considérable et augmentera l'efficacité de votre travail de référencement.
      [*]Toujours chez Yooda, un analyseur et éditeur de fichier robots.txt, qui vous permet d'analyser le fichier robots.txt de votre site, et de l'éditer pour le corriger si nécessaire.

      Si vous voulez être tenu au courant dès la parution des autres outils en développement, n'oubliez pas d'éditer votre profil pour souscrire à la lettre mensuelle d'information du Hub.

      Cordialement,

      Les admins du Hub
    • By Cliquedur
      Bonjour à tous,

      J'ai fait des recherches sur le hub, mais ne pense pas avoir trouvé de réponse correspondant exactement.
      Maintenant, mon cerveau malade me joue souvent des tours sur des évidences

      Voilà : d'un site www.domaine1.com, nous passons à la même version, mais sur un nouveau nom de domaine, www.domaine2.com. Le deuxième adresse devient l'adresse principale à référencer.
      Nous avons le temps de laisser les deux versions en ligne, mais je veux
      - rediriger les visites pour domaine1 vers domaine2
      - transférer le référencement acquis du domaine1 vers le domaine2

      J'ai pensé à la redirection 301, mais Dan ayant signalé que yahoo! n'était pas forcément friand de cette technique, nous pensions laisser les deux versions en ligne, référencer la nouvelle adresse, et faire en sorte que le domaine1 soit désindéxé au profit du 2.
      Maintenant, pas question de laisser deux versions miroirs ... alors quelle est d'après vous la meilleure démarche ?

      Suffirait-il de faire pointer les dns du 1 vers le 2, de mettre une simple redirection ... ? et de placer une redirection 301 sur le 2 (en bloquant l'indexation du domaine1 avec une version alternative du robots.txt ?

      Bref, mon message doit montrer que c'est bien confus dans ma tête

      Bref, je suis un peu perdu

      Merci d'avance pour votre réponse, et bravo pour la qualité du forum.
    • By Cliquedur
      Bonjour,

      Je cherche une réponse concernant le choix de réécriture / redirection à faire dans cas d'un site dont tous (6) les noms de domaines ont été "sauvagement" soumis à Google (entre autres).

      Disons que l'adresse principale est www.domaine-principal.com, et que les 5 autres sont :
      www.domaine-2.fr, www.domaine-3.com, www.domaine-4.com, www.domaine-5.com et www.domaine-6.com.

      Tous les noms de domaine du site pointent vers l'adresse principale, pour un hébergement unique.
      Mais il est nécessaire de faire "le ménage", car google présente le site en faisant une rotation des urls avec des classements anarchiques, chose que je n'ai jamais vue encore. L'idée est que seule l'url principale apparaisse au final dans les résultats, et de ne pas perdre le peu de référencement aquis.

      Quelle serait, d'après-vous, la meilleure méthode par .htaccess : redirection permanente ? Réécriture ?

      Dan, tu m'as parlé de gérer tout cela par le .htaccess et des fichiers robots.txt, c'est bien cela ?

      Merci et à bientôt,
    • By Webmestre
      Bonjour,
      Je dois mettre en ligne la nouvelle version d'un site. Les nouvelles pages seront placées dans de nouveaux dossiers.
      Afin de ne pas ramener l'interaute sur une erreur 404 au cas ou il cliquerait sur un lien vers une ancienne page à partir d'un moteur de recherche, je pensais mettre dans chacune des ancinennes pages le script ci-dessous et placer un robots.txt interdisant la visite des anciens dossiers. Y-a-t-il d'autres solutions (je pense aux redirection 301 / 302 mais je n'en comprends pas bien le principe) ?
      Le but est à terme de faire disparaitre ces pages des moteurs pour pouvoir ensuite enlever ces dossiers du serveurs.

      <script Language="javascript">
      if (parent.frames.length==0) parent.location.href="default.htm"
      </SCRIPT>
×
×
  • Create New...