Aller au contenu

fedorax

Actif
  • Compteur de contenus

    23
  • Inscrit(e) le

  • Dernière visite

Réputation sur la communauté

0 Neutre
  1. Pour info le site est passé dans google le 25 ( Selon le cache ). Je le vois en position 3 sur google.fr
  2. Suite et fin de l'aventure... Le 11 Décembre google m'a refait un crawl encore plus fantaisiste de 52 urls recomposées à sa manière. J'ai piqué ma crise et j'ai enlevé le site map pour voir. Depuis plus aucun crawl fantaisiste et depuis le 16 décembre les nouvelles pages commencent à être indexées. Je n'ai toujours pas compris le pourquoi de la chose mais vu que ça remarche je ne touche plus à rien. J'ai également refait le htaccess selon le modèle de dan. C'est vrai que c'est plus propre. Joyeuses fêtes à tous.
  3. Je me demande si je n'ai pas fait une bourde dans les 301, le fait d'avoir redirigé un répertoire ( En considérant que index.html ou .php était implicite ) pourrait-il être à l'origine du problème ? Dans le doute j'ai supprimé la ligne.
  4. PS: Si j'essaie un lien de ce genre: http://gimp.org/index.html/toto/tata/tonto...xiste%20pas.php J'ai le site gimp de manière normale.
  5. Oui apparament le nav lit: /livres-titres.php/...... comme un fichier ( C'en est un et pas un répertoire ) et ne tient pas compte de ce qui suit sinon ça ferait en effet un 404. J'ai vu la réponse à propos du cataloge de pèche. Est-ce que ça pourrait venir du fait que le même répertoire contienne des fichiers: livres-titres-A.php, livres-titres-B.php etc ... ? Mais je ne vois quand même pas comment je peux trouver des trucs comme: http://www.bouquinique.com/livres-titres.p...rche/recherche/ Si /recherche est bien un répertoire situé à la racine il n'est dupliqué nulle part ailleurs et ne contient aucun fichier livres-qq.chose.
  6. Sur ma page d'index j'ai mis qrmbouq028 comme premier mot clé d'une balise keyword. Sur cette même page et tout en bas j'ai mis qrmbouq029. Dans tous les moteurs connus ( msn, yahoo, google ) une recherche sur qrmbouq028 ne donne rien. Par contre qrmbouq029 sort la page. Je doute que les metas keyword servent encore à qq. chose.
  7. Cette fois je ne comprend plus rien... Google est en train de crawler mon site un peu partout mais sur une page on dirait qu'il mélange toutes les URL's qu'il trouve dans le code de la page pour fabriquer des url's qu'il se met à crawler aussi en confondant le fichier livres-titres.php avec un répertoire. Ex: /livres-titres.php/site-map.php /livres-titres.php/recherche/recherche/ /livres-titres.php/livres-titres-K.php /livres-titres.php/recherche/livres-titres-B.php Et il semble inventer toutes les combinaisons possibles. Ce n'est pas mon programme de stats qui a un bug ( Fonctionne depuis 2 ans, rien d'anormal dans le code source de la page qui passe au test W3C. Quant au site map ( Que je commence à regarder d'un oeil sombre ) il ne contient que: ----------------------------------------------- <url> <loc&gt;http://www.bouquinique.com/site-map.php</loc> <priority>0.5000</priority> </url> <url> <loc&gt;http://www.bouquinique.com/livres-titres.php</loc> <priority>0.5000</priority> </url> <url> <loc&gt;http://www.bouquinique.com/livres-titres-A.php</loc> <priority>1</priority> </url> ----- Jusqu'a livres-titres-Z.php ----------------------------------------------- Si quelqu''un comprend ou a déjà vu ça ailleurs ?
  8. Le robots.txt sur des pages qui n'existent plus et sont redirigées par une 301 je ne sais pas ce que ça pourrait donner. Possible que ça me bloque définitivement les nouvelles pages. La seconde solution c'est sans doute celle que j'aurais du appliquer dès que j'ai vu que google crawlait mes pages sans les remettre dans l'index mais j'ai horreur des trucs que je ne comprend pas et ça m'a poussé à essayer autre chose. Faute de mieux j'aurais acquis qq. connaissances dans un domaine ou j'ignorais presque tout. Pour l'instant comme il est spécifié dans la doc que la solution 2 ne fonctionne que sur des vraies 404 ça ne pourra pas marcher tant que les 301 seront actives et j'en ai besoin le temps que les autres moteurs indexent les nouvelles pages. ( Sur ce coup MSN est vraiment rapide, une bonne partie est déjà indexée, yahoo semble suivre de près ) Sitôt que tout sera clean dans les autres moteurs je vire les 301, j'essaie de faire sortir les vielles pages de google et après il fera bien ce qu'il veut. Il est passé hier sur les nouvelles pages via les 301, si je m'aperçois qu'il réindexe les anciennes ou qu'il n'indexe rien soit je laisse tomber, soit je pète une durite ! Quoi qu'il en soit je ferais une brève page web résumant l'aventure qaund tout sera fini.
  9. ??? Mais je n'ai jamais mis les anciennes adreses dans le sitemap. J'ai bien mis les nouvelles et c'est jiustement ça que je ne comprend pas: Je mets les nouvelles adresses dans le site map et il me renvoie des erreurs sur des pages qui n'existent plus et ne sont pas dans le site map.
  10. Ce qui cloche je le vois tout de suite en lisanr: " Cette version HTML du catalogue n'est utile qu'en cas d'indisponibilité ... " dans tous les en-têtes. Ce sont des pages qui traînent dans google depuis début 2004 et qui qui n'ont jamais disparu quoi que je fasse. Si tu fais site:bouquinique.com bouquinique com html A php pour les quelques pages qui traînent dans le cache tu verras: extraite le 19 juil 2005 20:33:30 GMT. Ce n'est d'ailleurs pas mieux sur d'autres moteurs. Ils indexent les nouvelles pages mais laissent traîner les vieux tromblons de 2003 dans leur index. Un indice : Que penses tu de ce que voit Google, lorsqu'il a un site comme ceci ? Je pense la même chose que toi mais que veux-tu que j'y fasse ? J'ai envoyé 3 mails depuis début novembre quand je me suis aperçu du bazar. J'ai déplacé toutes les pages ( D'ou les 301 ) en espérant que ça ferait disparaître les verions périmées. J'ai fait un rewrite pour éviter le mélange http et http://www. ( Ca au moins ça à l'air d'avoir marché, si tu fais le même test avec les www il ne sort presque plus de vieux trucs. Je ne vais quand même pas m'immoler par le feu ? En plus si je lis bien tous les messages ici ou ailleurs le problème est général et il m'arrive parfois de cliquer sur des liens google ( Ou autre moteur de recherche ) et de tomber sur un 404 parceque le site est fermé depuis 2 ans....
  11. Pour tout ce qui concerne les redirections et les fichiers .htaccess cette page: --http://www.toulouse-renaissance.net/c_outils/c_reduire_hits.htm M'a été d'une grande utilité. Elle pourrait sans doute servir à d'autres. ( Le sujet annoncé semble inapproprié mais le texte contient tout qu''il faut ).
  12. Aujourdh'ui je trouve ça dans mon site map ( Vu les dates on voit que les mises à jour sont assez lentes ): --------------------------------------------------- --http://www.bouquinique.com/html/ Web 404 introuvable déc. 1 --http://www.bouquinique.com/html/D.php Web 404 introuvable déc. 3 --http://www.bouquinique.com/html/L.php Web 404 introuvable nov. 28 --http://www.bouquinique.com/html/O.php Web 404 introuvable nov. 28 ------------------------------------------------------ Pourtant toutes les pages citées ci-dessus sont redirigées correctement en 301 ( L'étaient aussi à la date indiquée ) et mes stats montrent que google est bien tombé sur les nouvelles pages. Ca me laisse perplexe. Que prend t-il en compte maintenant? l'url avant redirection ou après redirection ? A part ça il n'a pas encore mis le nez dans les pages indiquées dans le site map.
  13. Pour l'explication je crois qu'il y-a du monde qui aimerait comprendre. J'ai eu la même chose avec un site. toutes les pages satellites disparues, revenues et redisparues. Par contre pour la page racine du même site c'est le grand amour. Il me la réindexe 2 fois par semaine.mais pas loin de 100 pages périmées depuis 2004 apparaissent toujours avec une commande site. Mes trois autres sites ( Dont je ne m'occupe presque plus ) sont eux indexés au moins deux fois par mois sur presque toutes les pages. Un seul reste en carafe et c'est justement le seul ou je vende qq. chose... On dirait qu'il reste sur les pages qui ne changent pas ( Cas des mes 3 sites aimés par google qui n'ont pas eu une modif depuis 6 mois ) alors qu'il boude celui qui avait des updates réguliers. Ce n'est même pas une question de ranking, les 4 sites ont tous 3 ou 4 comme niveau. Note en ce qui concerne les balises. Keywords est totalement ignoré par google.
  14. J'ai aussi trouvé un bout de statistique sur une recherche il y-a une semaine. Depuis plus rien bien que j'ai eu des visites provenant de recherches google. Je cheche toujours à comprendre la réelle utilité du sitemep. Il m'a bien, signalé une erreur mais sur une page qui n'était pas ajoutér au fichier sitemap ...
×
×
  • Créer...