Aller au contenu

fedorax

Actif
  • Compteur de contenus

    23
  • Inscrit(e) le

  • Dernière visite

Tout ce qui a été posté par fedorax

  1. Pour info le site est passé dans google le 25 ( Selon le cache ). Je le vois en position 3 sur google.fr
  2. Suite et fin de l'aventure... Le 11 Décembre google m'a refait un crawl encore plus fantaisiste de 52 urls recomposées à sa manière. J'ai piqué ma crise et j'ai enlevé le site map pour voir. Depuis plus aucun crawl fantaisiste et depuis le 16 décembre les nouvelles pages commencent à être indexées. Je n'ai toujours pas compris le pourquoi de la chose mais vu que ça remarche je ne touche plus à rien. J'ai également refait le htaccess selon le modèle de dan. C'est vrai que c'est plus propre. Joyeuses fêtes à tous.
  3. Je me demande si je n'ai pas fait une bourde dans les 301, le fait d'avoir redirigé un répertoire ( En considérant que index.html ou .php était implicite ) pourrait-il être à l'origine du problème ? Dans le doute j'ai supprimé la ligne.
  4. PS: Si j'essaie un lien de ce genre: http://gimp.org/index.html/toto/tata/tonto...xiste%20pas.php J'ai le site gimp de manière normale.
  5. Oui apparament le nav lit: /livres-titres.php/...... comme un fichier ( C'en est un et pas un répertoire ) et ne tient pas compte de ce qui suit sinon ça ferait en effet un 404. J'ai vu la réponse à propos du cataloge de pèche. Est-ce que ça pourrait venir du fait que le même répertoire contienne des fichiers: livres-titres-A.php, livres-titres-B.php etc ... ? Mais je ne vois quand même pas comment je peux trouver des trucs comme: http://www.bouquinique.com/livres-titres.p...rche/recherche/ Si /recherche est bien un répertoire situé à la racine il n'est dupliqué nulle part ailleurs et ne contient aucun fichier livres-qq.chose.
  6. Sur ma page d'index j'ai mis qrmbouq028 comme premier mot clé d'une balise keyword. Sur cette même page et tout en bas j'ai mis qrmbouq029. Dans tous les moteurs connus ( msn, yahoo, google ) une recherche sur qrmbouq028 ne donne rien. Par contre qrmbouq029 sort la page. Je doute que les metas keyword servent encore à qq. chose.
  7. Cette fois je ne comprend plus rien... Google est en train de crawler mon site un peu partout mais sur une page on dirait qu'il mélange toutes les URL's qu'il trouve dans le code de la page pour fabriquer des url's qu'il se met à crawler aussi en confondant le fichier livres-titres.php avec un répertoire. Ex: /livres-titres.php/site-map.php /livres-titres.php/recherche/recherche/ /livres-titres.php/livres-titres-K.php /livres-titres.php/recherche/livres-titres-B.php Et il semble inventer toutes les combinaisons possibles. Ce n'est pas mon programme de stats qui a un bug ( Fonctionne depuis 2 ans, rien d'anormal dans le code source de la page qui passe au test W3C. Quant au site map ( Que je commence à regarder d'un oeil sombre ) il ne contient que: ----------------------------------------------- <url> <loc&gt;http://www.bouquinique.com/site-map.php</loc> <priority>0.5000</priority> </url> <url> <loc&gt;http://www.bouquinique.com/livres-titres.php</loc> <priority>0.5000</priority> </url> <url> <loc&gt;http://www.bouquinique.com/livres-titres-A.php</loc> <priority>1</priority> </url> ----- Jusqu'a livres-titres-Z.php ----------------------------------------------- Si quelqu''un comprend ou a déjà vu ça ailleurs ?
  8. Le robots.txt sur des pages qui n'existent plus et sont redirigées par une 301 je ne sais pas ce que ça pourrait donner. Possible que ça me bloque définitivement les nouvelles pages. La seconde solution c'est sans doute celle que j'aurais du appliquer dès que j'ai vu que google crawlait mes pages sans les remettre dans l'index mais j'ai horreur des trucs que je ne comprend pas et ça m'a poussé à essayer autre chose. Faute de mieux j'aurais acquis qq. connaissances dans un domaine ou j'ignorais presque tout. Pour l'instant comme il est spécifié dans la doc que la solution 2 ne fonctionne que sur des vraies 404 ça ne pourra pas marcher tant que les 301 seront actives et j'en ai besoin le temps que les autres moteurs indexent les nouvelles pages. ( Sur ce coup MSN est vraiment rapide, une bonne partie est déjà indexée, yahoo semble suivre de près ) Sitôt que tout sera clean dans les autres moteurs je vire les 301, j'essaie de faire sortir les vielles pages de google et après il fera bien ce qu'il veut. Il est passé hier sur les nouvelles pages via les 301, si je m'aperçois qu'il réindexe les anciennes ou qu'il n'indexe rien soit je laisse tomber, soit je pète une durite ! Quoi qu'il en soit je ferais une brève page web résumant l'aventure qaund tout sera fini.
  9. ??? Mais je n'ai jamais mis les anciennes adreses dans le sitemap. J'ai bien mis les nouvelles et c'est jiustement ça que je ne comprend pas: Je mets les nouvelles adresses dans le site map et il me renvoie des erreurs sur des pages qui n'existent plus et ne sont pas dans le site map.
  10. Ce qui cloche je le vois tout de suite en lisanr: " Cette version HTML du catalogue n'est utile qu'en cas d'indisponibilité ... " dans tous les en-têtes. Ce sont des pages qui traînent dans google depuis début 2004 et qui qui n'ont jamais disparu quoi que je fasse. Si tu fais site:bouquinique.com bouquinique com html A php pour les quelques pages qui traînent dans le cache tu verras: extraite le 19 juil 2005 20:33:30 GMT. Ce n'est d'ailleurs pas mieux sur d'autres moteurs. Ils indexent les nouvelles pages mais laissent traîner les vieux tromblons de 2003 dans leur index. Un indice : Que penses tu de ce que voit Google, lorsqu'il a un site comme ceci ? Je pense la même chose que toi mais que veux-tu que j'y fasse ? J'ai envoyé 3 mails depuis début novembre quand je me suis aperçu du bazar. J'ai déplacé toutes les pages ( D'ou les 301 ) en espérant que ça ferait disparaître les verions périmées. J'ai fait un rewrite pour éviter le mélange http et http://www. ( Ca au moins ça à l'air d'avoir marché, si tu fais le même test avec les www il ne sort presque plus de vieux trucs. Je ne vais quand même pas m'immoler par le feu ? En plus si je lis bien tous les messages ici ou ailleurs le problème est général et il m'arrive parfois de cliquer sur des liens google ( Ou autre moteur de recherche ) et de tomber sur un 404 parceque le site est fermé depuis 2 ans....
  11. Pour tout ce qui concerne les redirections et les fichiers .htaccess cette page: --http://www.toulouse-renaissance.net/c_outils/c_reduire_hits.htm M'a été d'une grande utilité. Elle pourrait sans doute servir à d'autres. ( Le sujet annoncé semble inapproprié mais le texte contient tout qu''il faut ).
  12. Aujourdh'ui je trouve ça dans mon site map ( Vu les dates on voit que les mises à jour sont assez lentes ): --------------------------------------------------- --http://www.bouquinique.com/html/ Web 404 introuvable déc. 1 --http://www.bouquinique.com/html/D.php Web 404 introuvable déc. 3 --http://www.bouquinique.com/html/L.php Web 404 introuvable nov. 28 --http://www.bouquinique.com/html/O.php Web 404 introuvable nov. 28 ------------------------------------------------------ Pourtant toutes les pages citées ci-dessus sont redirigées correctement en 301 ( L'étaient aussi à la date indiquée ) et mes stats montrent que google est bien tombé sur les nouvelles pages. Ca me laisse perplexe. Que prend t-il en compte maintenant? l'url avant redirection ou après redirection ? A part ça il n'a pas encore mis le nez dans les pages indiquées dans le site map.
  13. Pour l'explication je crois qu'il y-a du monde qui aimerait comprendre. J'ai eu la même chose avec un site. toutes les pages satellites disparues, revenues et redisparues. Par contre pour la page racine du même site c'est le grand amour. Il me la réindexe 2 fois par semaine.mais pas loin de 100 pages périmées depuis 2004 apparaissent toujours avec une commande site. Mes trois autres sites ( Dont je ne m'occupe presque plus ) sont eux indexés au moins deux fois par mois sur presque toutes les pages. Un seul reste en carafe et c'est justement le seul ou je vende qq. chose... On dirait qu'il reste sur les pages qui ne changent pas ( Cas des mes 3 sites aimés par google qui n'ont pas eu une modif depuis 6 mois ) alors qu'il boude celui qui avait des updates réguliers. Ce n'est même pas une question de ranking, les 4 sites ont tous 3 ou 4 comme niveau. Note en ce qui concerne les balises. Keywords est totalement ignoré par google.
  14. J'ai aussi trouvé un bout de statistique sur une recherche il y-a une semaine. Depuis plus rien bien que j'ai eu des visites provenant de recherches google. Je cheche toujours à comprendre la réelle utilité du sitemep. Il m'a bien, signalé une erreur mais sur une page qui n'était pas ajoutér au fichier sitemap ...
  15. Exact mais vu que sur la page d'inscription on lit: Je ne pense pas que l'excès de BP soit facturé d'office. Par contre comme partout ailleurs en cas de dépassement le site sera OUT avec un message signifiant que la BP du mois est épuisée.
  16. Pour info le site 1&1 vient de prolonger son offre jusqu'au 31/12/2005. J'y ai ouvert un compte il y-a peu, à première vue ça a l'air bien surtout pour ceux qui n'ont pas d'hébergement ou qui ont un compte gratuit bardé de pubs. Sinon ce n'est jamais inutile d'avoir de l'espace disponible avec les BDD en prime.
  17. Oui, c'est généralement le cas d'un forum qui marche bien. En matière d'informatique je me demande si il existe quoique ce soit de prévu.... J'étais tranquille j'étais peinard et j'ai reçu un mail "On ne voit plus tes titres dans google!" petites causes grands effets. Je vais déjà tester une boucle simple pour voir ce que ça sort et comment ça rend. En tout cas très instructif ce forum.
  18. L'url rewriting même si j'en avais entendu parler j'ai découvertr ça seulement aujourdh'ui... A vrai dire en cas de besoin je pense que je pourrais tout ramener à un seul paramètre constitué d'une seule chaîne de caractères contenant tous les paramètres. Ca fait un gros boulot de modif mais si vraiment il le faut...
  19. Ce que toi et cendrillon voulez dire ce serait Une page du genre: Tant qu'il y-a des fiches Lire le titre Créer un lien /affichage.php?var=montitre continuer La logique voudait qu'en indexant la page et en suivant le lien vers la fonction d'affichage google indexe tous les titres un par un mais c'est la question que je m'étais posée quand j'ai commencé le site: Google et les autres peuvent-ils tous suivre ce genre de liens ?
  20. Oui, c'est exactement ça. Au lieu de faire un truc qui me fabrique des pages html j'aurais sans doute pu me contenter d'une page php qui balaye la base de données pour chaque lettre de l'alphabet sur le champ titre et google aurait sans doute indexé les titres des pages trouvées mais vu qu'en matière de référencement je suis un poil neuneu je n'avais pas vraiment de certitudes alors qu'en sortant des pages normales j'étais certain qu'elles seraient plus ou moins indexées. Faire une fiche par titre ça me tente bien. Ca permettrait d'avoir le titre du livre en tag et dans le texte donc sans doute un meilleur classement pour la même recherche. Je vais sans doute m'y mettre dans la semaine.
  21. Déjà merci pour toutes ces réponses qui m'ont appris pas mal de trucs. C'est la question que je me pose. Peut-être que google n'aime pas la tartine de variables qui suit l'url du moteur de recherche ? Maintenant si il me semblerait logique que google aille chercher dans la base de données une URL en dur du genre: recherche.php?Find=tous les titres de la lettre A Comment pourrait-il trouver des données à partir d'un site ou la chaîne de variables déterminant les titres à afficher dépend des entrèes d'un formulaire fourni par l'utilisateur ? Ici un truc m'échappe. Sinon les pages html générées restent utiles, certains utilisateurs sont largués dès qu'il faut taper 3 mots das un moteur et préfèrent une page alphabétique avec tous les titres. En tout cas une chose est certaine, lors de la mise en service du site toutes les pages ont été rapidement indexées mais aucun moteur ne m'a indexé un titre avant que je ne fasse ces fameuses pages. Pour une seule raison, c'est que comme je n'avais pas prévu que des pages aux titres et metas identiques me posent un jour problème j'ai mis un en tête commun pour tous les fichiers. Je vais refaire ça sous peu. J'en suis très loin seul le titre des pages et les metatags sont identiques. Ce qui m'a interpellé c'est que les pages générées ont disparu de google depuis qu'ils ont changé leur système d'index. Mais le meilleur reste à dire: Les pages disparues de l'index depuis 15 jours sont toutes mystérieusement revenues dans la journée. Heureusement que comme conseillé plus haut j'ai fait une 301 vers la nouvelle version et qu'elle marche. Google me rendra fou ( Si ce n'est déjà fait ). Ceci dit je vais quand même faire les modifs prévues on n'est jamais trop prudent.
  22. Bonjour, En parcourant ce forum j''ai déjà trouvé une partie des réponses à mes questions et j'en conclus que je suis bon pour une réécriture de certaines pages web. Je cherche qq. idées pour ne pas me tromper. Le problème de base ( Déjà posé un peu plus bas ): Le référencement de la page d'accueil m'importe relativement peu, pour moi ce qui est vital c'est que chaque article proposé ( Livres ) se voie référencé par son titre dans les moteurs. Comme les moteurs n'indexent pas ( Ou si ils le font je ne m'en suis jamais aperçu ) le contenu d'une base de données MySql j'ai créé un générateur de pages web qui reprend tous les titres pour en faire un index alphabétique lisible par les moteurs. Jusqu'au mois dernier ça marchait sans problème, mais depuis qq. temps toutes ces pages ne sont plus visibles dans google ( Le site n'est pas blacklisté la page d'accueuil existe toujours ) . Vu que ces pages étaient un peu loin de la racine du site ( sous répertoires /html/a/index.php, /html/b/index.php ) j'ai pensé que ça pouvait poser problème et j'ai tout refait en ramenant les pages dans la racine et en leur donnant un nom plus explicite ( livres_a.php, livres_b.php, etc ... La page d'accueil porte un lien vers la page index_alpha.php et la page index_alpha.php contient les 26 liens vers livres_a.php, livre_b.php, etc ... ). J'aurais du lire ce forum avant car faites à partir d'un générateur ces pages ont toutes les mêmes titres et headers et il semblerait que ce soit la raison de leur disparition. Sii ce que j'ai lu ce confirme elles ne risquent pas d'apparaître dans leur nouvelles versions. Pour différencier les en têtes des 26 pages alphabétiques ce n'est pas un problème. Une petite modif qui mes les noms des auteurs dans les mots clés devrait suffire mais pour les titres des pages ? Jusqu'a quel point doivent-ils se différencier ? Je ne peux quand même pas y coller des trucs du genre "pompes funèbres", "Casse croûte à toute heure", etc ... pour que les 26 soient différentes ? Sur ce point je coince un peu. Second problème, si il se confirme que google n'aime pas les redirections 302 il va être servi. Comme j'ai déménagé les pages d'origine bien indexées dans les autres moteurs je n'ai guère eu le choix et j'ai un beau .htacces bien chargé au moins jusqu'au moment ou les nouvelles pages seront indexées chez yahoo, msn, etc ... Ici je ne vois guère d'alternative sinon l'erreur 404. Et une dernière chose qui me laisse très perpexe c'est qu'avec un même nom de domaine je suis référencé chez google deux fois de manière différente. Une fois avec http://bouquinique.com et une seconde avec les www en prime. Je ne sais trop que faire sur ce coup, j'ai commencé un truc sur google sitemap en donnant les deux versions des url's pour chaque page mais je ne sais trop ce que ça va donner. Si quelqu'un peut me donner qq. idées avant que je n'attaque la xème modification ? Merci.
×
×
  • Créer...