Xethorn
mercredi 7 juillet 2004 à 19:49
La différence, c'est que google ne detecte pas le format utilisé, ne peut pas faire de transformation du langage utilisé lors de l'affichage.
Prenons le cas d'un simple é présent sur un site en UTF-8 et un autre é présent sur un autre site mais qui n'est pas en UTF-8. Google devrait normalement, renvoyer un affichage en UTF-8 pour éviter des bugs. Je m'explique : le "é" qui n'est pas dans un format unicode est convertit pour ne pas créer de bug avec l'affichage du "é" en UTF-8.
L'avantage residerait, non pas dans les accents, mais plus dans les caractères (chinoix - Kanji) qui n'auraient aucun problème à s'afficher (ses caractères sont inexistants en ISO-8859-1). Il arrive quelque fois à google de plancher sur le langage choisit par le site web et ceux pour plusieurs raisons.
La première est principalement dans le fait que l'UTF8 est très mal détécté, c'est à dire que vous mettez UTF8, mais que vous avez éditer votre page au format ISO (de mon experience sous windows, il est impossible de choisir l'encodage des fichiers lors de leur édition). Donc, en somme, il y a un mélange de formats, ce qui peut-être la cause d'affichage de points d'interrogation à la place des caractères ou lettres choisies.
Ou il se peut également que ce soit une erreur de charset au niveau de la configuration du serveur. En ce qui me concerne, je n'ai pour le moment rencontré aucun soucis de ce côté là.
Maintenant, d'un point de vue uniquement professionnel, il est préférable d'utilisé é au lieu de é puisque l'on donne directement l'entité html ce qui permet d'éviter des conflits lorsque les navigateurs ne connaissent pas l'UTF-8. Après tout, c'est une question de choix finalement
Rajout : il se peut que ce soit votre navigateur lui-même ou que ce soit google qui oublit de définir le charset à utiliser, dans ce cas le navigateur internet utilise le charset par default. Ce n'est donc pas forcement une erreur qui provient de votre site