Aller au contenu

Probleme avec GoogleBot


Sujets conseillés

re ,

j'ai un petit sushi avec googlebot qui n'est pas très futé mais peut être trop logique.

Lorsqu'il indexe mes pages , il index 3 écritures différentes (pour le moment ...) de ma pages par exemple :

il index :

-www.monsite.fr/insuma.php?num_langue=7&num_page=79&flash=non <=== Pure invention de google , je sais pas ou il la trouve

et

-www.monsite.fr/insuma.php <=== LA BONNE

et

-www.monsite.fr/insuma.php?PHPSESSID=21722c3eacbe4aa4779485f4cd200818 <=== Pure invention de google , je sais pas ou il la trouve

toutes les 3 sont les mêmes ... elles ramènent a la même page !

Mais je nai besoin que de l'écriture simple !!

j'ai verifié , je n'ai aucun lien avec cette écriture a rallonge !

Comment faire pour que google arrête d'indexer ces pages ?

Redirect 301 ?? mais comment

Modifié par Dan
Lien vers le commentaire
Partager sur d’autres sites

Bonjour,

Je vais essayer de deviner. :hypocrite:

il index :

-www.monsite.fr/insuma.php?num_langue=7&num_page=79&flash=non <=== Pure invention de google , je sais pas ou il la trouve

Googlebot ne supporte pas Flash, donc, comme pour toute visite de ton site avec un navigateur sans Flash, le &flash=non s'ajoute à l'URL.

-www.monsite.fr/insuma.php?PHPSESSID=21722c3eacbe4aa4779485f4cd200818 <=== Pure invention de google , je sais pas ou il la trouve

Googlebot ne supporte pas les cookies et beaucoup de scripts ajoutent un numéro de session quand ils sont visités par un navigateur qui n'accepte pas les cookies.

Pas sûr à 100%, mais très probable. ;)

Jean-Luc

Lien vers le commentaire
Partager sur d’autres sites

possible ... je ne connais pas grand chose .

en tous cas les liens de mon site pointent vers des adresses simples comme celle en verte.

Comment je fais pour interdire google de faire ces inventions ?

Lien vers le commentaire
Partager sur d’autres sites

possible ... je ne connais pas grand chose .

en tous cas les liens de mon site pointent vers des adresses simples comme celle en verte.

Comment je fais pour interdire google de faire ces inventions ?

Google n'invente rien, si ces adresses sont indexées, c'est qu'ils les a trouvées dans un lien.

Si tu désactives les cookies dans ton navigateur, tu devrais voir apparaître le PHPSESSIONID. Je suppose qu'en changeant d'autres paramètres, et en parcourant un peu le site pas forcément par le menu principal, on doit pouvoir retrouver les autres paramètres amusants qui sont rajoutés (comme le flash=non en désactivant flash). C'est le script de ton site qui est en cause, et il va falloir le modifier (il est possible que ce soit de grosses modifs) si tu veux vraiment faire disparaître ces url.

En théorie, une session ne devrait jamais être initiée par un lien (methode HTTP GET), mais uniquement après un POST (de formulaire). Comme les robots ne suivent pas les POST le PHPSESSIONID n'apparaît pas, si cette règle était respectée.

Modifié par Lanza
Lien vers le commentaire
Partager sur d’autres sites

pourtant jai cherché de partout , ils ne sont pas dans mes pages.

c'est possible avec le htaccess de redireger ces pages à rallonge vers le formet simple ?

si on se connecte sur /voyages.php?********** on soit redirigé sur /voyages.php ?? par le 301 mais de le faire de maniere general

Lien vers le commentaire
Partager sur d’autres sites

pourtant jai cherché de partout , ils ne sont pas dans mes pages.
As-tu essayé de visiter ton site avec un navigateur sans Flash comme nous t'avons suggéré ?

Jean-Luc

Lien vers le commentaire
Partager sur d’autres sites

jai accédé a mon site par IE cette fois et jai ceci a un endroit :

Vous devez avoir Macromedia Flash. 
<a href="http://www.macromedia.com/go/getflashplayer/"> Obtenir Macromedia FLash
</a> Si c'est deja installe
<a href="index.html?detectflash=false">cliquez ici

c'est une page de photos.

Mais jai le meme prb sur la page d'index de mon site :

/index.php?PHPSESSID=21722c3eacbe4aa4779485f4cd200818

Lien vers le commentaire
Partager sur d’autres sites

<?
if($_SERVER["REQUEST_URI"]!=$_SERVER['PHP_SELF'])
header('Location: '.$_SERVER["PHP_SELF"]);
?>

Bon, c'est l'esprit quoi.

Si il y a une requête derrière le .php, on redirige vers la page en .php.

Mais Google n'invente rien, le mieux serait de supprimer le problème à la base.

Lien vers le commentaire
Partager sur d’autres sites

sinon cela pourrai marcher ?

Ben non, et pour plusieurs raisons:

- la première est que la query string n'apparaît jamais dans l'expression en premier membre d'une règle

- la seconde est que si cela marchait tu ne pourrais plus avoir aucune URL avec des variables.

Tu dois utiliser un session_start() dans tes sources, et il ne faut pas utiliser cela pour les moteurs, tous simplement.

Dan

Lien vers le commentaire
Partager sur d’autres sites

Vas lire ce post: http://www.webmaster-hub.com/index.php?s=&...ost&p=30655

Tu y apprendras comment désactiver les sessions pour les moteurs.

Ces URLs ne sont pas dans tes sources parce que le PHPSESSID est généré automatiquement par php. ;)

Fais une recherche sur "session_start()" tu trouveras la ou les pages fautives.

Lien vers le commentaire
Partager sur d’autres sites

si jai bien compris je met ce code en debut de mes fichiers .php

<?php
/* Ouverture de session conditionnelle, pas pour les robots identifies */

// Spider/Bot pour référencement
$spiders = array( "Googlebot", "crawler", "Slurp", "Fast", "ia_archiver", "Scooter", "Robot", "VoilaBot", "W3C", "ZyBorg", "Deepindex", "xecho" );
$from_spider = false;
foreach($spiders as $Val) {
if (eregi($Val, $_SERVER["HTTP_USER_AGENT"])) {
$from_spider = true;
break;
}
}
// Session ini_set("session.use_trans_sid", "0");
if(!$from_spider) {
session_start();
}

?>

Lien vers le commentaire
Partager sur d’autres sites

Tu as parfaitement compris...

Tu mets ce code en lieu et place de l'appel à session_start().

Libre à toi d'éditer la liste des moteurs.

Dan

Lien vers le commentaire
Partager sur d’autres sites

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...