Aller au contenu

Du ménage dans les urls


Sujets conseillés

Bonjour,

Je cherche une réponse concernant le choix de réécriture / redirection à faire dans cas d'un site dont tous (6) les noms de domaines ont été "sauvagement" soumis à Google (entre autres).

Disons que l'adresse principale est www.domaine-principal.com, et que les 5 autres sont :

www.domaine-2.fr, www.domaine-3.com, www.domaine-4.com, www.domaine-5.com et www.domaine-6.com.

Tous les noms de domaine du site pointent vers l'adresse principale, pour un hébergement unique.

Mais il est nécessaire de faire "le ménage", car google présente le site en faisant une rotation des urls avec des classements anarchiques, chose que je n'ai jamais vue encore. L'idée est que seule l'url principale apparaisse au final dans les résultats, et de ne pas perdre le peu de référencement aquis.

Quelle serait, d'après-vous, la meilleure méthode par .htaccess : redirection permanente ? Réécriture ?

Dan, tu m'as parlé de gérer tout cela par le .htaccess et des fichiers robots.txt, c'est bien cela ?

Merci et à bientôt,

Lien vers le commentaire
Partager sur d’autres sites

Salut Franck,

Effectivement, il s'agit en fait de fournir un fichier robots.txt different pour les sites qui ne doivent pas être indexés. Comme ça, pas de risque de pénalité pour contenu dupliqué.

Crées un fichier robots.txt.noindex qui contient par exemple:

User-agent:  *
Disallow: /

Ensuite, dans un fichier .htaccess à la racine, tu mets les lignes suivantes:

RewriteEngine on
RewriteCond %{HTTP_HOST} ^(.+)\.domaine2\.fr$ [OR]
RewriteCond %{HTTP_HOST} ^(.+)\.domaine3\.com$ [OR]
RewriteCond %{HTTP_HOST} ^(.+)\.domaine4\.com$ [OR]
RewriteCond %{HTTP_HOST} ^(.+)\.domaine5\.com$ [OR]
RewriteCond %{HTTP_HOST} ^(.+)\.domaine6\.com$
RewriteRule robots.txt robots.txt.noindex [L]

Donc pour tous les domaines cités tu présentes le fichier robots.txt.noindex ...

Tu peux simplifier la règle avec une seule ligne, en utilisant la négation

RewriteCond %{HTTP_HOST} !^(.+)\.domaine-principal\.com$
RewriteRule robots.txt robots.txt.noindex [L]

Qui présentera le fichier robots.txt.noindex pour tous les domaines différents de *.domaine-principal.com

;)

Dan

Lien vers le commentaire
Partager sur d’autres sites

Un grand merci, Dan :up:

Je vais tester la seconde solution directement.

Y a-t-il un moyen de tester directement ? Il me semble avoir vu un de tes posts parlant d'opera, il me semble.

En faisant comme cela, on peut donc s'attendre à voir disparaître les domaines secondaires des index. Par contre, pas de transfert des acquis au domaine principal, n'est-ce pas ?

Lien vers le commentaire
Partager sur d’autres sites

Salut Franck,

Pas besoin d'Opera, comme on ne fait pas de détection du UserAgent. Il te suffit de demander le fichier robots.txt pour les différents domaines en l'appellant directement dans ton butineur.

Tu peux aussi utiliser le visualisateur d'entêtes http de notre page outils pour les fichiers robots.txt. Tu y verras les redirections ;)

Dan

Jeu - de - piste / concours 2005:

Le premier d'entre vous qui fera remonter ce post en citant ce texte se verra offrir le nom de domaine en .com

Lien vers le commentaire
Partager sur d’autres sites

Invité
Ce sujet ne peut plus recevoir de nouvelles réponses.
×
×
  • Créer...