suede Posted November 19, 2005 Posted November 19, 2005 Dans certaines de mes urls, slurp me rajoute %E2%8C%A9 . Cela provoque bien sur des erreurs 404. Est-ce que quelqu'un en connait l'origine (a priori, je ne suis pas le seul à qui cela arrive et seul slurp a ce probleme). François
Dan Posted November 19, 2005 Posted November 19, 2005 Salut Suede, C'est d'autant plus surprenant que Yahoo! n'est pas en mesure de fournir le cache de ces pages (comprenant cette chaîne dans l'URL) Une recherche sur yahoo: http://fr.search.yahoo.com/search?ei=UTF-8...25A9&meta=vl%3D donne pour le cache de toutes les pages l'erreur suivante: Désolé, mais nous n'avons pas pu traiter votre demande en raison de la mémoire cache de -http://www.ilocartes.com/?cat=EXCUSES%25E2%258C%25A9=. Veuillez cliquer ici pour vérifier la page actuelle. avec seulement l'URL qui diffère. Dan
Jeanluc Posted November 19, 2005 Posted November 19, 2005 Bonjour, Ce que fait Yahoo, c'est vérifier astucieusement le traitement des erreurs 404 sur le site. Il demande une adresse qui n'existe pas et espère recevoir une erreur 404. S'il reçoit un code 302 ou 200, il sait que, pour ce site, certaines redirections 302 ou certains codes 200 sont, en fait, des pages inexistantes et il pourra en tenir compte. Voir Yahoo! Search : your crawler is asking for strange URLs that have never existed on my site. Jean-Luc
suede Posted November 19, 2005 Author Posted November 19, 2005 Bonjour, Ce que fait Yahoo, c'est vérifier astucieusement le traitement des erreurs 404 sur le site. Il demande une adresse qui n'existe pas et espère recevoir une erreur 404. S'il reçoit un code 302 ou 200, il sait que, pour ce site, certaines redirections 302 ou certains codes 200 sont, en fait, des pages inexistantes et il pourra en tenir compte. Voir Yahoo! Search : your crawler is asking for strange URLs that have never existed on my site. Jean-Luc <{POST_SNAPBACK}> Ca en fait quand même un paquet de vérification... 1 par jour suffirait peut-etre...
Jeanluc Posted November 19, 2005 Posted November 19, 2005 Ca en fait quand même un paquet de vérification... 1 par jour suffirait peut-etre... C'est bizarre. Chez moi, sur un site dont il visite 13000 pages, il fait le test sur une ou deux adresses chaque mois. Jean-Luc
Jeanluc Posted November 20, 2005 Posted November 20, 2005 Après réflexion, mon explication n'est pas la bonne, car, lors de ses vérifications du fonctionnement des erreurs 404, Yahoo utilise des URL comme /SlurpConfirm404/niigata.htm. Peux-tu donner l'une ou l'autre URL complète avec ces %E2%8C%A9 ? Jean-Luc
Dan Posted November 20, 2005 Posted November 20, 2005 Il n'y en a aucune dans le cache yahoo! sur le site photos-suede.com http://fr.search.yahoo.com/search?p=inurl%...=wrt&meta=vl%3D Mais j'ai donné le lien dans ma première réponse, et ce sont des sites qui ne traitent pas correctement les arguments passés en URL. Je pense que comme Suede traite correctement ces requêtes en renvoyant une entête 404, il n'y a pas de problème potentiel pour son site.
suede Posted November 20, 2005 Author Posted November 20, 2005 photo-628/main_back-photo10%E2%8C%A9=en/ photo-430/main_back-photo10%E2%8C%A9=sv/ photo-312/main_back-photo10%E2%8C%A9=fr/ photo-258/main_back-photo10%E2%8C%A9=fr/ id_theme-16/back_theme-8%E2%8C%A9=en/ id_theme-41/back_theme-40%E2%8C%A9=fr/ photo-787/main_back-photo7b%E2%8C%A9=fr/ photo-784/main_back-photo7%E2%8C%A9=sv/ loupe-653%E2%8C%A9=en/ photo-797/main_back-photo5%E2%8C%A9=en/ photo-767/main_back-photo7%E2%8C%A9=en/ photo-803/main_back-photo7b%E2%8C%A9=sv/ photo-56/main_back-photo4%E2%8C%A9=fr/ photo-793/main_back-photo5%E2%8C%A9=sv/ photo-336/main_back-photo2%E2%8C%A9=fr/ photo-802/main_back-photo7%E2%8C%A9=en/ photo-714/main_back-photo10%E2%8C%A9=fr/ photo-352/main_back-photo9%E2%8C%A9=fr/ photo-448/main_back-photo10%E2%8C%A9=sv/ photo-84/main_back-photo3b%E2%8C%A9=fr/ photo-524/main_back-photo4%E2%8C%A9=en/ photo-780/main_back-photo7%E2%8C%A9=sv/ id_theme-20/back_theme-18%E2%8C%A9=fr/ photo-693/main_back-photo10%E2%8C%A9=en/ photo-77/main_back-photo9%E2%8C%A9=fr/ liste-photo-5%E2%8C%A9=sv/ all-photo-5%E2%8C%A9=sv/ C'est systématiquement la même structure. Normalement, les liens sont du type lang-fr/photo-84/main_back-photo3b/ Je n'arrive pas à trouver quelque chose dans mon code qui en serait la raison et je n'arriver pas à reproduire l'erreur. Et il n'y a que slurp qui me le fait :-( Une question : %E2%8C%A9 , ca veut dire quoi en caractères normaux ? François
Jeanluc Posted November 20, 2005 Posted November 20, 2005 Une question : %E2%8C%A9 , ca veut dire quoi en caractères normaux ? En caractères "normaux", ça pourrait être 〈 (a circonflexe, OE ligaturé, copyright) ou une sorte de < ("left-pointing angle bracket" = 〈 = ucode2329). Comme le dit Dan, tu renvoies des erreurs 404, donc il n'y a pas de souci à se faire, à moins que les liens mal construits ne soient sur ton propre site. Jean-Luc
suede Posted November 20, 2005 Author Posted November 20, 2005 En caractères "normaux", ça pourrait être â© (a circonflexe, OE ligaturé, copyright) ou une sorte de < ("left-pointing angle bracket" = 〈 = ucode2329). Comme le dit Dan, tu renvoies des erreurs 404, donc il n'y a pas de souci à se faire, à moins que les liens mal construits ne soient sur ton propre site. Jean-Luc <{POST_SNAPBACK}> A priori, ca pourrait être donc 〈= mais je n'en ai plus en théorie. par contre, je ne voie pas d'où viendrait le < ??? Va falloir que je cherche dans mes fichiers. Le probleme est que c'est une fonction qui s'occuppe du changement de langue. Bon, bah au boulot ... François
Jeanluc Posted November 20, 2005 Posted November 20, 2005 D'après ce que tu dis, je pense à une confusion entre ton paramètre de langue et l'entité HTML 〈. Tu a écris (ou tu as cru écrire) /blabla.php?machin=abc&lang=en et quelqu'un a lu /blabla.php?machin=abc〈en, puis converti le 〈 en %E2%8C%A9. Jean-Luc P.S. Dans mon post précédent, le "<" était un exemple de "left-pointing angle bracket".
suede Posted September 11, 2006 Author Posted September 11, 2006 J'ai trouvé l'erreur :-) Un fichier auquel je n'avais pas pensé car accessible uniquement par JS et dans lequel j'avais un noindex, nofollow. Bah, Slurp a indexé et "followé" les liens Je ne sais pas d'ou biens l'erreur, mais je pense que c'est l'appel d'une url à parametres via un JS. François
suede Posted October 2, 2006 Author Posted October 2, 2006 Quelqu'un a une idée de la provenance d'un En ? A priori, c'est un charactère qui s'est glissé mais je ne le trouve pas. exemple id_theme-22/back_theme-15En/ au lieu de id_theme-22/back_theme-15/ Comme d'hab, seul Yahoo me trouve ces erreurs là!
Jeanluc Posted October 2, 2006 Posted October 2, 2006 Comme d'hab, seul Yahoo me trouve ces erreurs là!Y'a qu'à demander à Yahoo où il l'a trouvé. Recherche Yahoo pour id_theme-22/back_theme-15En/ Jean-Luc
suede Posted October 3, 2006 Author Posted October 3, 2006 Y'a qu'à demander à Yahoo où il l'a trouvé. Recherche Yahoo pour id_theme-22/back_theme-15En/ Jean-Luc J'avais regardé google uniquement :-) Merci
Recommended Posts
Please sign in to comment
You will be able to leave a comment after signing in
Sign In Now