Version complète: sur le forum Webmaster Hub : renseignements pour remplacer underscore par tiret
Webmaster Hub > Création et exploitation de Sites Internet > Les langages du Net > Fichier .htaccess et réécriture d'URLs
Vent40
bonjour

sur mon site ,les noms de fichiers comportent des underscores que je voudrais remplacer par des tirets
ex: la_clarine*tte;html par la-clarine*tte.html
occasion_ins*truments.html par occasion-ins*truments.html

comment dois-je faire?
est ce que je dois tout changer a la main ainsi que les liens ds les pages?
ou existe t-il un moyen plus rapide?
et est ce que je dois utiliser l'url rewriting pour eviter le duplicate content et que dois je mettre ds le fichier htaccess?
merci bien
kot
Si tu fais le l'url rewritting, ça prends 5 minutes il faut juste le temps de comprendre comment ça marche.
Par contre, l'url rewriting va te permettre de créer une pseudo page la-clarine qui va pointer sur la_clarine
Tu vas tout de même devoir mettre à jour les liens de ton site qui pointaient sur la_clarine pour les transformer en la-clarine.
Du coup, je ne suis pas sur que cela vaille le coup dans ce contexte


De plus, l'avantage de changer les liens à la main, c'est que tu va réellement renommer les pages. Les pages du type la_clarine n'existeront donc vraiment plus. Les moteurs de recherche vont vite s'en apercevoir et vont supprimer l'ancienne page. Dans le cas du rewritting les anciennes pages existent toujours et il n'y a pas moyen de les cacher (à ma connaissance).

^_^
Vent40
il faut qd meme que j'utilise l'url rewriting pour rediriger les pages avec underscore vers celle avec tiret sinon je vais avoir du duplicate content non
kot
non,

pas si tu renommes les pages
les crawlers vont vite se rendre compte que tes anciennes pages ont disparu.

J'en ai fait l'expérience avec google et mon site.
J'ai même pas eu le temps de réagir, deux semaines après la mise en route du rewriting, les anciennes pages ont disparues de l'index google.

Si tu veux être plus carré que moi, il suffit de demander la désindexation des anciennes pages sur GG. Ce formulaire ne doit être utilisé que si les anciennes pages n'existent plus.
Le-juge
CITATION
comment dois-je faire?
est ce que je dois tout changer a la main ainsi que les liens ds les pages?
ou existe t-il un moyen plus rapide?


Tu peux faire du rewriting mais les liens dans tes pages doivent etre ceux qui sont rewrite! Attention!

CITATION
et est ce que je dois utiliser l'url rewriting pour eviter le duplicate content et que dois je mettre ds le fichier htaccess?


Pour eviter le duplicate content c'est pas du rewriting qu'il faut que tu utilise ce sont des redirections (301 de preference).

Apres Kot a pas tort des fois ca va vite ... tout depends si tu as des positions ou pas.

Il faut quand meme savoir qu'on ne fait pas d'url rewriting n'importe comment non plus cela peut avoir de graves consequences sur ton site. Pour Kot ca s'est bein passe tant mieux ...c'est pas tout le temps comme ca...
Vent40
comment faire avec le rewriting pour avoir les pages avec les tirets?
je connais pas bp!
merci
Cleden
CITATION(Vent40 @ mardi 31 janvier 2006, 20h53)
comment faire avec le rewriting pour avoir les pages avec les tirets?
je connais pas bp!
merci
*

CODE
RewriteRule ^(.*)_(.*)_(.*)_(.*).html$ /$1-$2-$3-$4.html [R=301,L]
RewriteRule ^(.*)_(.*)_(.*).html$ /$1-$2-$3.html [R=301,L]
RewriteRule ^(.*)_(.*).html$ /$1-$2.html [R=301,L]

Ce code te sert à rediriger visiteurs (et robots) cherchant une page avec underscore vers la page correpondante avec tiret; Tu conserve ainsi ton référencement.
Tu place ce code dans ton htaccess et tu renomme tes pages en remplacant l'underscore par le tiret (il faudra aussi changer les liens).

J'ai l'impression d'avoir déjà vécu cette scène wink.gif

Loïc.
kot
Si j'ai bien compris ta réponse, il doit renommer les fichiers à la main, renommer tous les liens pointant sur ces fichiers à la main et utiliser
le htaccess pour résoudre son problème de duplicate content!
c'est ça?

Le problème est le même que si il ne fait pas de htaccess, il faut que les moteurs crawlent pour voir la mise à jour. Et s'ils ne se rendent pas compte que l'ancienne page n'existe plus / est redirigée, il va y avoir deux copies de la même page dans l'index.

wink.gif
Cleden
CITATION(kot @ mercredi 01 février 2006, 10h43)
Si j'ai bien compris ta réponse, il doit renommer les fichiers à la main, renommer tous les liens pointant sur ces fichiers à la main et utiliser
le htaccess pour résoudre son problème de duplicate content!
c'est ça?

C'est ça
CITATION(kot @ mercredi 01 février 2006, 10h43)
Le problème est le même que si il ne fait pas de htaccess, il faut que les moteurs crawlent pour voir la mise à jour. Et s'ils ne se rendent pas compte que l'ancienne page n'existe plus / est redirigée, il va y avoir deux copies de la même page dans l'index.
wink.gif
*

Les redirection htacces ne servent à rien, c'est nouveau ça vient de sortir blink.gif

L'ancienne url des pages redirigera directement vers la nouvelle, les moteurs s'en rendront compte et élimineront l'ancienne url. Maintenant, si tu préfère avoir tes erreurs 404 qui vont trainer pendant 2 ans et perdre le référencement des anciennes pages, c'est à toi de voir wink.gif

Loïc.
kot
Non, je ne veux pas dire que les htaccess ne servent à rien, blush.gif
t'as raison mieux vaut que le moteur sache que la page a bougé.

Je voulais dire qu'il y a quand même un moment de flottement où des nouvelles pages sont indexées et les anciennes n'ont pas été mise à jour et cela quelle que soit la méthode utilisée. dots.gif


Pour accélérer le processus de mise à jour,
je conseillerai quand même de faire un sitemap. Car d'après mon expérience les anciennes pages se sont trouvées rapidement désindexées.

Par contre, j'ai perdu le référencement des anciennes pages, c'est sûr!
(Mais j'avais un autre problème que je n'ai pas su résoudre et avec lequel je ne vais pas pourrir ce post...) nerd.gif
slender
C'est terminé, google a résolu son problème concernant son habitude à ignorer l'underscore comme séparateur. Fini l'URL_REWRITING...
Voir Abondance
petit-ourson
Pourquoi fini la ré-écriture d'url est terminée ?

C'est juste le problème des underscores qui est terminé.
slender
naturellement, la réécriture aura heureusement encore de beaux jours devant elle... Je parlais de la réécriture dédiée au problème de la non reconnaissance de l'underscore en terme de séparateur... wink.gif
Ceci est une version "bas débit" de notre forum. Pour voir la version complète avec plus d'information, la mise en page et les images, veuillez cliquer ici.