Aller au contenu

Supprimer une URL


Sujets conseillés

Bonjour,

Je ne suis pas un webmaster mais un simple novice en informatique. Je vous prie, ne me méprisez pas ! :)

Voilà, j'ai posté des contributions sur un forum et le webmaster a accepté de les supprimer à ma demande. Ces posts me posaient quelques problèmes. Le problème est que durant plusieurs mois (au moins 6 !!!) les pages cachées et les snippets sont restés en place et on pouvait facilement retrouver mes contributions. Et ça m'a causé des soucis :sick: Quand on cliquait sur le lien on avait un message qui disait que le post n'était plus accessible mais si on cliquait sur la version cache on avait l'intégralité du post avec mes coordonnées. Bref, pour moi ça revenait au même. J'ai alors contacté le webmaster qui a orienté chacun de mes liens vers un message d'erreur. Il m'a affirmé que ça rendrait plus rapide la suppression des liens. Est-ce vrai ? Et le défendez-pas parce qu'il est web ! Dites la vérité les gars ! :)

Moi, j'en ai assez de voir ces liens, ces snippets et ces pages cachées alors je suis allé sur google afin d'accélérer le truc. Google dit : "Si votre demande est urgente et ne peut pas attendre la prochaine exploration de votre site par Google, faites appel à notre système de suppression automatique d'URL. Nous accepterons votre demande de suppression uniquement si la page renvoie une véritable erreur 404 par l'intermédiaire des en-têtes http. Assurez-vous de renvoyer une véritable erreur 404 même si vous choisissez d'afficher une version plus conviviale de la page HTML à l'attention de vos visiteurs. Il est inutile de renvoyer une page avec le message "Fichier introuvable" si les en-têtes http renvoient le code d'état 200 ("normal")."

Je ne comprends rien ! :blush: Les pages renvoie à un message d'erreur mais il y a un numéro à quatre chiffre style mySQL error: 1049, rien à voir avec 404. Et quand je veux supprimer les liens (j'ai créé un compte) et que je mets le lien à supprimer et valide google me répond :"Cette page semble toujours figurer sur le Web."

Je sais plus quoi faire. :( Le webmaster ne s'est-il pas trompé dans ce qu'il fallait faire ? (Ne le prenez pas mal, ça arrive à tout le monde de faire des erreurs !)

Pouvez-vous m'aider ?

Merci.

Dirlo.

Lien vers le commentaire
Partager sur d’autres sites

Ce qu'il faut que ton webmaster fasse, c'est générer une erreur 404 lors de l'affichage des pages en question.

S'il utilise le PHP, c'est facilement réalisable avec la fonction header.

Il fera ensuite une redirection de toutes les pages en erreur 404, vers une page d'erreur personnalisée (voir le tutorial ici : le fichier .htaccess, section "La page d’erreur « sur mesure »".

Une fois que c'est fait, tu pourras vérifier que tout fonctionne bien en vérifiant les en-têtes avec l'outil du Hub, pour vérifier que le code d'erreur retourné est bien un code 404 (la page n'existe pas).

Et seulement ensuite, tu pourras demander à Google de désindexer les pages en question.

PS : tu peux directement commencer à regarder les en-têtes renvoyées avec l'outil susmentionné.

Si ça se trouve, ton webmaster a déjà tout mis en oeuvre pour le gérer.

Lien vers le commentaire
Partager sur d’autres sites

Bonjour captain-torche,

Merci pour ta réponse. Mais l'affaire est plus complexe. En fait, le forum est désactivé depuis longtemps. Il était sur un site qui par contre est toujours actif pour d'autres fora. Mais les pages cachées et les snippets de mes contributions apparaissaient toujours car le début des URL renvoyaient au site encore actif (je te donne là les explications du webmaster qui au départ a refusé de supprimer mes contributions - il a fallu que je contacte la CNIL pour le forcer à le faire). :blush: (désolé pour les webmasters intervenant ici)

Le webmaster a donc contacté Google pour savoir comment procéder et c'est goggle qui a trouvé cette solution manifestement (là encore selon ses dires). Je voudrais savoir avant de faire ce que tu dis si le numéro à quatre chiffres mySQL error: 1049 suffira à la longue à supprimer les versions caches et snippets de mes contributions et au bout de combien de temps.

Que signifie cette formule magique ? :) Je ne comprends rien.

En effet, si c'est trop long je procéderai comme tu dis. Mais la webmaster pourra-t-il le faire vu que le forum est désactivé selon ses dires sur ce site là. Il l'a recrée ailleurs mais sans mettre mes contributions (sur une autre adresse) ? Et selon lui c'est l'adresse du site qu'il faudrait supprimer or, il héberge d'autres fora et cela ne l'arrange pas.

Merci pour tes réponses,

Dirlo.

Lien vers le commentaire
Partager sur d’autres sites

Pour les "chiffres magiques" dont tu parles, ça ne changera rien : c'est apparemment que la page qui est appelée ne reçoit pas les bons paramètres, et "plante".

Pour notre cas, il faut que le webmaster fasse aboutir les urls précises enregistrées dans google, vers une page non-existante (générer le code d'erreur 404).

Le souci principal, c'est qu'il ne s'agit pas de 'ton' webmaster (ce que j'avais compris au début). Tu as déjà effectué une démarche pour le forcer à supprimer tes contributions, je doute que vos relations soient extrèmement cordiales ;)

Et en fait, il a fait tout ce qui était de sa responsabilité pour supprimer tes messages (les enlever de sa base de données). Les pages enregistrées dans le cache de google ne sont plus de sa responsabilité, et il n'est donc pas du tout obligé de faire les démarches pour qu'elles disparaissent de l'index.

Lien vers le commentaire
Partager sur d’autres sites

Salut,

Ok, je vais le mettre au courant alors.

Tu dis : "Et en fait, il a fait tout ce qui était de sa responsabilité pour supprimer tes messages (les enlever de sa base de données). Les pages enregistrées dans le cache de google ne sont plus de sa responsabilité, et il n'est donc pas du tout obligé de faire les démarches pour qu'elles disparaissent de l'index".

Si en fait. :) Supprimer les versions caches au regard de la loi relève de la responsabilité du webmaster. Selon google aussi qui explique très bien au webmaster comment procéder pour supprimer aussi ces versions caches. La jurisprudence a tranché ce débat depuis quelques années. En effet, c'est le webmaster qui a googlelisé son site et toutes les données et donc c'est à lui de supprimer ces données là. ;) Un problème technique ne saurait prévaloir sur le respect de la loi qui protège la vie privée des individus. Et, entre nous, heureusement ! ;)

Merci pour tes réponses,

Dirlo.

Lien vers le commentaire
Partager sur d’autres sites

Je serai curieux de voir le texte de jurisprudence en question.

Parce que tout de même, il n'y a aucune démarche à faire pour le webmaster, pour qu'un site lambda se retrouve 'gougeulisé' dans notre cher moteur de recherche (vu qu'il s'agit d'un opt-out, et non d'un opt-in, via le fichier robots.txt).

Lien vers le commentaire
Partager sur d’autres sites

Il suffit de chercher sur le net. ;) ou de contacter la CNIL ;)

Un webmaster peut très bien refuser d'avoir son site googlelisé en effectuant des démarches. S'il refuse de le faire alors, il accepte les règles de google. Cela signifie qu'il accepte d'être sous le coup de la loi Informatiques et Libertés qui protège l'individu, sa vie privé, etc. Or, google dit bien ne jamais être responsable du contenu d'une page... C'est donc le webmaster dont on peut faire fermer le site, etc.

Techniquement, seul le webmaster peut supprimer url, pages cachées, snippets. Donc c'est à lui de le faire.

:)

Je viens de t'envoyer un message privé. Pourrais-tu y répondre s'il te plaît ?

Merci.

Dirlo.

Lien vers le commentaire
Partager sur d’autres sites

Bonjour

En effet, c'est le webmaster qui a googlelisé son site
Pas d'accord avec cette phrase.

Cela fait belle lurette que personne ne remplit plus le formulaire d'indexation chez Google, Yahoo ou MSN. Ou alors ceux qui le font le font en connaissance de cause: en sachant que çà ne va pas changer grand-chose au processus d'indexation.

La plupart du temps c'est plutôt les robots qui viennent d'eux-mêmes, et comme le dit captain_torche: c'est la logique de l'opt-out: si on ne dit pas explicitement aux robots de ne pas venir, alors ils indexent tout ce qu'ils trouvent.

Je me souviens d'un site que j'avais 'bloqué' entièrement aux robots: çà tambourinait à la porte :!: Le jour où j'ai autorisé le robots il ne m'a pas fallu plus de quelques heures pour retrouver mon site un peu partout (pages de résultats, Alexa, etc..). Ce n'est pas évident de se 'calfeutrer' !

Quant à Google, à les entendre ils ne sont jamais responsables de rien et il faut toujours se débrouiller sans eux :(

Le problème va se poser de mettre des 404 si tes messages ne sont pas les seuls sur les pages du dit-forum. Les messages d'autres membres n'ont pas à être désindéxés.

Lien vers le commentaire
Partager sur d’autres sites

Dudu, bonjour,

Le webmaster peut refuser de googleliser son site. Donc, en ne prenant pas de mesure contre, il accepte de se soumettre à la loi google. Il prend sur lui la responsabilité de voir googleliser toutes les coordonnées, contributions de son site, etc. Il est logique qu'il soit responsable au regard de la loi. Sinon tu imagines les récriminations que recevrait google au niveau mondial. Donc la loi a tranché : c'est le webmaster qui est responsable de tout. C'est plus simple et plus cohérent. Il doit résoudre les problèmes en conformité avec la loi sinon il n'ouvre pas de site. ;)

Dans l'histoire que tu me racontes, tu vois bien que c'est toi qui as ouvert la porte ! Tu aurais pu la laisser fermer ! ;)

"Le problème va se poser de mettre des 404 si tes messages ne sont pas les seuls sur les pages du dit-forum. Les messages d'autres membres n'ont pas à être désindéxés."

Non car le forum en question a été désactivé mais le site sur lequel il était est encore actif. Donc ça ne devrait pas poser de problèmes.

Par ailleurs, même si c'était le cas, cela regarde le webmaster, pas moi. Moi, je demande à ce que mes droits soient respectés. C'est donc à lui de trouver une solution technique pour régler ce problème.

Dirlo

Lien vers le commentaire
Partager sur d’autres sites

Dudu, bonjour,

Le webmaster peut refuser de googleliser son site. Donc, en ne prenant pas de mesure contre, il accepte de se soumettre à la loi google. Il prend sur lui la responsabilité de voir googleliser toutes les coordonnées, contributions de son site, etc. Il est logique qu'il soit responsable au regard de la loi. Sinon tu imagines les récriminations que recevrait google au niveau mondial. Donc la loi a tranché : c'est le webmaster qui est responsable de tout. C'est plus simple et plus cohérent. Il doit résoudre les problèmes en conformité avec la loi sinon il n'ouvre pas de site. ;)

Oui et non, çà ressemble à du sophisme.

Un webmaster, ou plus globalement un responsable éditorial est maître de son contenu: çà lui appartient et il est donc le garant. C'est sur sa responsabilité, çà oui.

Maintenant, le contenu de Google ou Yahoo, c'est 'leur' contenu, même s'il est repêché.

Si le forum a été désactivé, alors les moteurs de recherche mettront à jour leurs snippets lors de leur prochaine visite. Je ne crois pas que le webmaster en question ait légalement d'autres actions à faire.

De plus, quelles sont les requêtes où l'on voit tes coordonnées ? Si ce n'est que des requêtes nominatives que personne ne demandera jamais, on peut légitimement dire que la gêne est minime.

Dans l'histoire que tu me racontes, tu vois bien que c'est toi qui as ouvert la porte ! Tu aurais pu la laisser fermer ! ;)
Le problème n'est pas tant d'avoir ouvert la porte. Le problème est surtout que si l'on ne souhaite pas voir son contenu sur des pages de résultats dans les moteurs de recherches, ou qu'on ne souhaite pas apparaître dans le classement Alexa, ou qu'on ne souhaite pas avoir une capture d'écran de son site sur whois.sc (devenu domaintools), ou ... ou .. etc.. et bien ce n'est pas évident.

On râle beaucoup quand les robots ne passent pas assez, mais l'inverse est au moins aussi rageant.

Pour cet exemple, mon fichier robots.txt était bien plus demandé (en quête d'une mise-à-jour) que d'ordinaire: le nombre de hits était assez impressionnant.

Lien vers le commentaire
Partager sur d’autres sites

Salut Dudu,

Je vois bien que tu défends ta boutique. Mais ne le prends pas mal, je veux simplement le respect de ma vie privée et donc de mes droits. C'est tout.

Pour la question : "qui est responsable, webmaster ou google ?". La réponse n'est pas simple.

Google dit :

http://www.google.fr/accounts/TOS

"Google n'accepte aucune responsabilité d'aucune sorte en ce qui concerne la précision, le contenu, l'exhaustivité, la légitimité, la fiabilité, l'opérabilité ou la disponibilité des informations ou des données affichées dans les résultats obtenus par les Services de recherche Google. etc. "

Par ailleurs concernant les pages cachées :

"Demande de suppression de lien ou de données mises en cache

Les index de Google sont constitués à partir d'informations qui sont détectées, identifiées, indexées et compilées par un processus entièrement automatisé sans aucune intervention ou révision par des personnes humaines. Compte tenu du volume considérable d'information qui évolue sur les sites Web par ajout, suppression ou modification et de la fréquence de ces évolutions, Google n'a pas la possibilité ni l'intention d'analyser le contenu mis à la disposition des utilisateurs via ses index. Pour chaque site Web présent dans les index de Google, deux situations sont envisageables : (i) Le propriétaire d'un site souhaite limiter l'accès à tout ou partie de son contenu. (ii) Un site est retiré du Web. Dans ces deux cas, à réception d'une requête émanant du propriétaire du site (ou d'une tierce partie dans le deuxième cas), Google étudiera au cas par cas la demande exprimée, en vue de supprimer de ses index le ou les liens qui pointent vers ce site. Toutefois, si l'opérateur ou le webmaster du site ne prend pas les précautions nécessaires (modification du code), les robots automatiques utilisés par Google pour créer et mettre à jour ses index risquent de détecter ce site très rapidement et de le réindexer.

Par ailleurs, Google stocke une copie texte de la plupart des pages Web dans une mémoire cache pour permettre aux utilisateurs de consulter ou de récupérer celles-ci en cas d'incident affectant le serveur de ces pages Web et empêchant leur affichage. Le propriétaire d'un site peut empêcher les robots Google de récupérer la version « cachée » de ses pages en y insérant la métabalise NOARCHIVE. Le propriétaire du site peut également demander la suppression immédiate des pages de son site qui sont cachées par les Services de recherche de Google. Google évalue ces requêtes au cas par cas, mais ne garantit pas que toutes les requêtes seront satisfaites. "

DONC tu vois bien que tout part du propriétaire qui est la source ! :) S'il ne fait pas ce qu'il faut google retrouvera les pages cachées.

Or, pour la justice il y a toujours un responsable HUMAIN. Je rappelle que google est un robot. Pas un webmaster ;)

Tu dis : "Si le forum a été désactivé, alors les moteurs de recherche mettront à jour leurs snippets lors de leur prochaine visite. Je ne crois pas que le webmaster en question ait légalement d'autres actions à faire.".

Le forum est inactif mais il est sur un site où d'autres fora sont actifs ! Donc google considère que les pages où figuraient mes contributions aujourd'hui supprimées existent encore et donc ne veut pas supprimer les versions caches et les snippets.

Merci pour vos réponses et remarques.

Dirlo

PS : Ne peut-on pas penser ce problème d'un point de vue moral ? Un webmaster ne devrait-il pas supprimer les pages cachées des contributions d'un individu si celui-ci lui demande ?

Lien vers le commentaire
Partager sur d’autres sites

Techniquement, google est un site.

Ce site possède un algorithme de recherche et d'indexation de pages (que nous appellerons le 'robot'.

Cet algorithme a forcément été programmé par des êtres humains, donc sous leur responsabilité.

Lien vers le commentaire
Partager sur d’autres sites

Je vois bien que tu défends ta boutique.
?? Pardon ? Quelle boutique ? Que signifie cette phrase ?

DONC tu vois bien que tout part du propriétaire qui est la source ! :) S'il ne fait pas ce qu'il faut google retrouvera les pages cachées.
Mais que voulais-tu ?

Que le webmaster sache à l'avance qu'il allait te virer et qu'il faudrait supprimer tes messages ? Il aurait donc du ne jamais laisser les moteurs de recherches mettre en cache dès le début ?

Non.

Alors les pages sont en cache.. et elles disparaitront petit à petit.

Je rappelle que google est un robot. Pas un webmaster ;)
Ah bon ? :blink:

Tu dis : "Si le forum a été désactivé, alors les moteurs de recherche mettront à jour leurs snippets lors de leur prochaine visite. Je ne crois pas que le webmaster en question ait légalement d'autres actions à faire.".

Le forum est inactif mais il est sur un site où d'autres fora sont actifs ! Donc google considère que les pages où figuraient mes contributions aujourd'hui supprimées existent encore et donc ne veut pas supprimer les versions caches et les snippets.

Je comprends de moins en moins. Tes coordonnées existent-elles encore sur ce site ?

Si oui: tu demandes au webmaster de les enlever, et les moteurs de recherche mettront à jour leurs caches au prochain passage (en les supprimant à la leur tout)

Si non: il faut juste attendre patiemment que les caches se mettent à jour.

Tu as regardé sur d'autres moteurs que Google ce qu'il en était ?

PS : Ne peut-on pas penser ce problème d'un point de vue moral ? Un webmaster ne devrait-il pas supprimer les pages cachées des contributions d'un individu si celui-ci lui demande ?
Tu as l'air de trouver çà simplissime, mais çà ne l'est pas.

Supprimer une page 'cache' d'un moteur de recherche çà ne se fait pas en un clic.

Çà se fait soit en contactant le moteur de recherche (et en priant très fort pour qu'ils répondent)

Soit en attendant la mise-à-jour des caches.

Les pages caches ne sont que le reflet du site avec quelques jours de décalage. Si la version originale n'est plus en ligne, alors le cache disparaitra quelques jours plus tard.

Google n'est pas un site MAIS un moteur de recherche ! C'est une machine pas un être humain !
:blink:

HAL ?

Lien vers le commentaire
Partager sur d’autres sites

Au niveau moral, n'est-il pas choquant de reprocher à quelqu'un (ici : le webmaster) de ne pas supprimer chez les autres (ici : les moteurs de recherche) toutes les traces et tous les souvenirs des "erreurs" qu'on a faites chez lui ?

Lien vers le commentaire
Partager sur d’autres sites

Le problème ne se pose pas tant pour Google que pour l'ensemble des moteurs de recherche. S'il est facile, pour un webmaster, de s'adresser à Google, il lui est en revanche difficile de trouver tous les moteurs de recherche qui sont susceptibles d'indexer un site, puis de faire le ménage..

Pour info, les moteurs de recherche se cachent derrière la sacro sainte loi du 'moteur automatique', mais ca reste du vol de contenu. Le moteur ne fait qu'accélérer le processus, en aucun cas cela ne devrait le dédouanner de sa responsabilité.

Si c'était de la musique, le problème ne se poserait pas, le débat a déjà eu lieu de multiples fois. Mais pour ce qui est des images, elles sont déjà toutes indexées, laissant par la même le législateur sur le 'carreau', et idem pour les textes. Les moteurs passent, indexent, puis disent 'oui, mais on va pas tout controler' !!

Un peu comme si je créais un robot capable de passer dans toutes les rues, de prendre des photos (pour la bonne cause), et que tu retrouverais chez toi dès que t'as le dos tourné. Je répondrais que.. 'Je peux pas 'controler' tous ses déplacements, et que tu peux toujours fermer ta porte à clé..

Lien vers le commentaire
Partager sur d’autres sites

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...