Version complète: sur le forum Webmaster Hub : Rajouter une page
Webmaster Hub > Création et exploitation de Sites Internet > Les langages du Net > (X)HTML et CSS
Nullette
Bonjour,
j'ai besoin de vos conseils pour restructurer quelques pages.

Actuellement j'ai une page qui se trouve à la racine du site, je dois ajouter une nouvelle page qui concerne le même sujet mais sur une autre période + scinder la page actuelle. Au final je devrais avoir trois pages.

Je pense donc créer un dossier/répertoire, dans lequel je mettrai une page de présentation (faut-il la nommer "index.html" , ou un autre nom ou bien garder le nom de la page actuelle ?).
Je devrai également indiquer le changement dans un fichier .htaccess.

Cette page est bien référencée et j'aimerais évidemment qu'elle le reste.
D'autre part, je voudrais savoir quels sites ont fait un lien vers cette page, mais j'ai du me tromper de code (link:*ttp://www.bulgaria-france.net/hist.html -site:www.bulgaria-france.net), car je n'ai pas obtenu le résultat voulu.

A votre avis quelle serait la meilleure façon de procéder ?
Dudu
Salut Nullette wink.gif

Rien ne t'empêche non plus de créer, toujours à la racine du site, des pages qui s'appeleraient hist2.html, hist3.html, hist4.html etc etc.. si tu trouves cela plus simple.

Maintenant, il est préférable effectivement de travailler l'architecture du site pour avoir des "friendly URLs". À ce propos, voici deux liens fort intéressants (et en anglais uniquement malheureusement): Voici ce que je ferais à ta place:
  • créer ce nouveau répertoire
  • déplacer ta page dans ce répertoire
  • mettre un .htaccess à la racine du site pour notifier la redirection à la fois à tes visiteurs, mais également aux moteurs de recherche (une en-tête 301 te permettra de conserver positionnement et backlinks)
    CODE
    Redirect permanent /hist.html http://www.bulgaria-france.net/hist/
  • vérifier avec l'outil de visualisation des en-têtes HTTP du Hub que la redirection s'effectue bien avec une en-tête 301 (sinon supprimer d'urgence le code, et taper Dudu tongue.gif)
  • appeler ton fichier soit index.html (ainsi c'est lui qui s'affichera lorsque l'adresse "bulgaria-france.net/hist/" sera appelée).
    Ou bien le nommer "ce-que-tu-veux.html" et mettre dans un .htaccess dans le répertoire /hist/ (et pas à la racine du site excl.gif) le code suivant:
    CODE
    DirectoryIndex ce-que-tu-veux.html ce-que-veux-en-2eme-choix.html ce-que-veux-en-3eme-choix.html ce-que-veux-en-4eme-choix-etc-etc.html
  • ne faire des liens qu'avec l'URL "bulgaria-france.net/hist/" sans mention du fichier d'index (c'est la méthode que je préfère pour diverses raisons, notamment à cause du risque de duplicate content qui peut arriver sinon, et pour la pérennité des URLs si l'extension de la page doit changer)
Te reste ensuite à créer les autres pages du répertoire comme bon te semble.

À propos:
- Google ne donne pas le nombre exact de liens pointant vers une page (pour d'obscures raisons), préfères par exemple Yahoo (indique juste "link:site/tld/page.html")
- le mot "répertoire" est préféré à "dossier" car c'est le nom officiel sous les systèmes UNIX (majoritaires dans l'hébergement web)

Bon courage.
Nullette
Merci Dudu.
Je préfère prêter attention à la structure de mon site, car j'aurai bien d'autres pages à ajouter et je pense qu'il vaut mieux créer des répertoires pour éviter de trop nombreuses pages à la racine du site, même si je ne sais pas trop pour quelle raison il vaut mieux avoir des répertoires biggrin.gif à part le fait d'obtenir des "friendly URLs".

Par contre tu m'avais dit toi-même qu'il valait mieux ne pas nommer index.html une page à l'intérieur d'un répertoire, car elle pourrait être interprétée comme un sous-domaine (si j'ai bien compris).
Dudu
CITATION(Nullette @ mardi 17 janvier 2006, 00h34)
même si je ne sais pas trop pour quelle raison il vaut mieux avoir des répertoires  biggrin.gif à part le fait d'obtenir des "friendly URLs".

Une des raisons importantes aussi (oserais-je dire la raison principale) c'est toi-même et ton confort de travail.
Puisque tu gère un site statique et non quelque chose propulsé dynamiquement par un quelconque CMS, tu risquerais de te retrouver avec une liste impressionnante de fichiers à chaque connexion FTP..

CITATION(Nullette @ mardi 17 janvier 2006, 00h34)
Par contre tu m'avais dit toi-même qu'il valait mieux ne pas nommer index.html une page à l'intérieur d'un répertoire, car elle pourrait être interprétée comme un sous-domaine (si j'ai bien compris).
blink.gif
Si j'ai réellement dit çà, c'est que j'avais préalablement fumé tout mon jardin laugh.gif

Non, j'avais certainement du citer (ou vouloir du citer) les arguments que j'ai exposé ici, à savoir:
- possibilité de changement d'extension (.shtml, .php, .phtml, .php, .jsp, .asp, .cgi, .pl..)
- éviter le duplicate content (d'ailleurs avec un langage comme PHP, il est assez simple de bloquer ou rediriger la requête si le fichier d'index est appelé nominativement, ce qui est encore mieux)
Denis
CITATION(Dudu @ lundi 16 janvier 2006, 21h14)
blink.gif
Si j'ai réellement dit çà, c'est que j'avais préalablement fumé tout mon jardin laugh.gif

Pas juste le tien mon ami, le mien aussi. ^_^

Ce que j'ajouterais à tout cela, c'est qu'il y a un intérêt à mettre chaque document dans son propre répertoire et de le nommer index. Ainsi, les URLs sont toujours plus simples et si du jour au lendemain on change de technologie, rien ne bouge (ex. passer de index.html à index.php dans un répertoire service).
Nullette
C'est moi qui fume, ou plutôt mon cerveau qui fume biggrin.gif

J'ai retrouvé le message de Dudu (privé, mais que je me permets de reproduire) :
CITATION
Attention toutefois si tu souhaites tout réorganiser de cette manière car pour les moteurs de recherche "www.site.tld/traditions/index.html" est une URL différente de "www.site.tld/traditions/" alors qu'il peut très bien s'agir de la même page en réalité: c'est un cas fréquent de duplicate content. Il en va de même pour les URL avec ou sans les www.


Je jours-là je me suis précipitée à renommer les index.html qui se trouvaient dans mes répertoires car mon interprétation est qu'il vaut mieux ne pas avoir d'index dans les répertoires pour éviter le "duplicate content" ... blink.gif
et voilà que Denis me dit de mettre un index dans chaque répertoire.

Quoi que
CITATION
mettre chaque document dans son propre répertoire et de le nommer index.

j'ai souvent plusieurs documents (pages html) dans les répertoires, celui que je devrais nommer index serait la page qui présente les pages contenues dans le répertoire.

Je ne sais toujours pas comment procéder ...
Cendrillon
CITATION(Nullette @ mardi 17 janvier 2006, 13h44)
CITATION(Dudu)
Attention toutefois si tu souhaites tout réorganiser de cette manière car pour les moteurs de recherche "www.site.tld/traditions/index.html" est une URL différente de "www.site.tld/traditions/" alors qu'il peut très bien s'agir de la même page en réalité: c'est un cas fréquent de duplicate content. Il en va de même pour les URL avec ou sans les www.


CITATION(Denis @ mardi 17 janvier 2006, 04h33)
Ce que j'ajouterais à tout cela, c'est qu'il y a un intérêt à mettre chaque document dans son propre répertoire et de le nommer index. Ainsi, les URLs sont toujours plus simples et si du jour au lendemain on change de technologie, rien ne bouge (ex. passer de index.html à index.php dans un répertoire service).

Je ne sais toujours pas comment procéder ...
*


bon, je vais te faire une réponse de normande ... aussi bizarre que cela puisse paraître, ils ont en fait tous les deux raison ... tant que Google n'aura pas résolu son problème d'URL canonique l'argument du duplicate content de Dudu est à prendre avec sérieux (et personnellement je ne préconise plus jamais de nommer des fichiers index.xxx ou default.xxx dans les sous répertoires pour cette raison) ...

et dans l'absolu, l'argument de Denis est indiscutable, et dès que Google aura résolu son problème d'URL canonique, c'est effectivement plus intéressant de faire comme Denis, pour les raisons qu'il a indiqué ...
Nullette
Merci Cendrillon.
Il serait intéressant d'avoir les commentaires de plusieurs webmasters qui ont un site en html pour savoir comment ils ont structuré leur site.

De toutes façons, je ne comprends pas grand chose, mais tout ce que je peux dire, bêtement, est que je ne vois aucune différence entre mes répertoires avec index et sans index, du point de vue référencement et satistiques.
Dudu
Hello,

je vais expliciter mon message point par point pour plus de clarté ^_^

CITATION
pour les moteurs de recherche "www.site.tld/traditions/index.html" est une URL différente de "www.site.tld/traditions/"

Pour un moteur de recherche, chaque URL différente correspond à une page différente.
Donc si une seule et même page est référencée sous plusieurs adresses, le moteur de recherche va considérer que tu as plusieurs fois la même page.
Donc "www.site.tld/traditions/index.html" est, pour le moteur de recherche, une page différente de "www.site.tld/traditions/"

CITATION
alors qu'il peut très bien s'agir de la même page en réalité:

Apache, dans sa configuration par défaut, ouvre l'éventuel fichier "index.html" lorsqu'on lui demande un répertoire sans préciser le fichier.
=> Donc "www.site.tld/traditions/index.html" est, pour Apache, la même page que "www.site.tld/traditions/"

CITATION
c'est un cas fréquent de duplicate content.

Récapitulons:
- "www.site.tld/traditions/index.html" est, pour le moteur de recherche, une page différente de "www.site.tld/traditions/"
- "www.site.tld/traditions/index.html" est, pour Apache, la même page que "www.site.tld/traditions/"
Il y a clairement un souci: pour l'un c'est la même page; et pour l'autre çà ne l'est pas ce sont 2 page différentes.
D'où une éventuelle pénalité pour contenu similaire (duplicate content) qui n'est pas méritée: c'est un problème que rencontrent beaucoup de webmasters.

CITATION
Il en va de même pour les URL avec ou sans les www.

Même problème que ci-dessus, mais exemple différent (autre possibilité de contenu similaire immérité):
"www.site.tld/page.html" <=> "site.tld/page.html"
Pour Apache, il s'agit (souvent) de la même page. Pour les moteurs de recherche, ce sont 2 pages distinctes.

Que faire ?
- éviter de nommer explicitement ses fichiers et ne donner que l'URL d'un répertoire sans mention du fichier par défaut
- ne pas faire de liens internes sans les www si tu souhaites garder le préfixe www (et vice-versa: ne pas faire de liens avec les www si tu ne souhaites pas garder le préfixe www)
- rediriger le trafic sans www vers www avec .htaccess (si l'hébergeur permet cette possibilité)
- rediriger le trafic de "www.site.tld/dossier/index.php" vers "www.site.tld/dossier/" (n'est pas possible en HTML, exige un langage de programmation tel que PHP ou JSP ou encore ASP et beaucoup d'autres).

**

nota bene:
  • à chaque fois que je parle de redirection dans ce message, il s'agit de redirection 301. Il existe aussi un autre code de redirection (le 302) mais là encore on se frotte à un autre bug des moteurs de recherche et on risque une désidexation de la page
  • Apache ouvre par défaut un éventuel fichier "index.html" pour les répertoires, mais il faut noter que IIS ouvre un éventuel fichier "default.html". Toujours bon à savoir pour s'éviter de mauvaises surprises lors d'un changement de configuration wink.gif
Nullette
Merci Dudu.
Conclusion : je ne mettrai pas de page index dans les répertoires et si un jour un webmaster me refera mon site il remettra tout en place correctement biggrin.gif
Ceci est une version "bas débit" de notre forum. Pour voir la version complète avec plus d'information, la mise en page et les images, veuillez cliquer ici.