Version complète: sur le forum Webmaster Hub : caractères "spéciaux"
Webmaster Hub > Création et exploitation de Sites Internet > Les langages du Net > (X)HTML et CSS
Maxim
Voila, je me pose la question suivante :
est ce que je dois me farcir (le mot est juste...) les &xxxx; à la place de caractères speciaux dans du html ?

Par exemple : choix entre :
’ et '
è et è
etc...

Pour info, j'utilise ceci :
<META http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
PwetPwet
&eacute; &egrave; &agrave; &amp; etc... enfin je crois, je suis pas codeur et regarde pas ma source, s'il te plait blush.gif
Maxim
ça je sais merci wink.gif , mais est ce que je serai plutot obligé de les utiliser ?
PwetPwet
bah je pense oui, c'est pour ca que je les avais mis dans ce sens(&eacute; &egrave; &agrave; &amp; etc...), mais faudrait que les supers codeurs te répondent.
Ca devrait pas tarder wink.gif
meta nando
Du moment que tu places la métadonnée
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
tu indique du encode en alphabet IS0-Latin-1. Tu peux donc écrire è ou ê à la place de &egrave; ou &circ;. Par contre il vaut mieux écrire &amp; à la place de & pour éviter les conflits.
Ganf
aucune raison d'inscrire les caractères spéciaux sous forme d'entité. Ce n'est nécessaire que si tu as besoin de caractères spéciaux qui ne sont pas disponnibles dans ton codage actuel.

Si tu ne sais pas de quoi je parle c'est que tu utilises le codage par défaut, l'ISO-8859-1. Et là les caractères français sont tout à fait supportés.
Ganf
CITATION
Par contre il vaut mieux écrire &amp; à la place de & pour éviter les conflits.


Mea culpa, j'avais oublié de préciser ça :
Tu es *obligé* d'encoder les caractères <, > et & si tu ne veux pas qu'ils soient interprétés. Ceci est une obligation (sauf cas spéciaux), ce n'est pas simplement "mieux".

Nota: c'est valable aussi pour les URL, http://example.org/page?param=valeur¶m2=valeur2 s'écrit
CODE
<a href="http://example.org/page?param=valeur&amp;param2=valeur2">xxx</a>
Maxim
oki oki

parfait alors !

pour le & oki c'est ce qu'il me semblait aussi

merci 1eye.gif
meta nando
CITATION
Tu es *obligé* d'encoder les caractères <, > et & si tu ne veux pas qu'ils soient interprétés. Ceci est une obligation (sauf cas spéciaux), ce n'est pas simplement "mieux".


Autant pour moir blush.gif
PwetPwet
bah voila, les pros sont passés, merci à tou(tes)s :up:
Anonymus
Et... puisque tu le demandes, les voici :
CITATION

" &quot;
& &amp;
< &lt;
> &gt;
  &nbsp;
¡ &iexcl;
¢ &cent;
£ &pound;
¤ &curren;
¥ &yen;
¦ &brvbar;
§ &sect;
¨ &uml;
© &copy;
ª &ordf;
« &laquo;
¬ &not;
­ &shy;
® &reg;
¯ &masr;
° &deg;
± &plusmn;
² &sup2;
³ &sup3;
´ &acute;
µ &micro;
¶ &para;
· &middot;
¸ &cedil;
¹ &supl;
º &ordm;
» &raquo;
¼ &frac14;
½ &frac12;
¾ &frac34;
¿ &iquest;
À &Agrave;
Á &Aacute;
 &Acirc;
à &Atilde;
Ä &Auml;
Å &Aring;
Æ &Aelig
Ç &Ccedil;
È &Egrave;
É &Eacute;
Ê &Ecric;
Ë &Euml;
Ì &Igrave;
Í &Iacute;
Î &Icirc;
Ï &Iuml;
Ð &eth;
Ñ &Ntilde;
Ò &Ograve;
Ó &Oacute;
Ô &Ocirc;
Õ &Otilde;
Ö &Ouml;
× &times;
Ø &Oslash;
Ù &Ugrave;
Ú &Uacute;
Û &Ucirc;
Ü &Uuml;
Ý &Yacute;
Þ &thorn;
ß &szlig;
à &agrace;
á &aacute;
â &acirc;
ã &atilde;
ä &auml;
å &aring;
æ &aelig;
ç &ccedil;
è &egrave;
é &eacute;
ê &ecirc;
ë &euml;
ì &igrave;
í &iacute;
î &icirc;
ï &iuml;
ð &eth;
ñ &ntilde;
ò &ograve;
ó &oacute;
ô &ocirc;
õ &otilde;
ö &ouml;
÷ &divide;
ø &oslash;
ù &ugrave;
ú &uacute;
û &ucirc;
ü &uuml;
ý &yacute;
þ &thorn;
ÿ &yuml;


Anonymus.
LaurentDenis
Les tableaux d'entités ne manquent pas sur le Web. Personnellement, j'ai un faible pour A Simple Character Entity Chart particulièrement complet et bien présenté.
Au passage, un premier article d'une série prometteuse sur la question chez Tainted Words (en français) : Jeux de caractères : c'est quoi ?
Xethorn
Les caractères tel que è, é, ê, ë, à (...) n'ont pas forcement besoin d'être modifiés.

Elle peuvent être comme ça dans le code source. Par contre, les entités html, elles doivent être converties : tel que & doit devenir &amp;, < doit devenir &lt;, > devient &gt; ...

Par contre, il faut faire attention au charset. Si ton fichier source est au format UTF-8 et que tu déclares en ISO, tu risques d'avoir des "?" dans ta page web (sauf si elles ont été converties en &quelquechose; là, ce format est compatible partout et c'est un des avantages).
Xethorn
Au passage, j'ai trouvé quelques caractères amusants :
ŧ ← ↓ → « (qui il me semble ne sont pas dans la liste)
Dan
J'aurais tendance à être plus nuancé dans la réponse à cette question.
Même si les é s'affichent de la même manière que les &eacute; , Google ne les référencie pas toujours de la même manière.

La meilleure manière de sortir à l'identique pour "référencement" et "referencement" (sans accents) est encore d'utiliser les &eacute; dans la page.

Dan
LaurentDenis
CITATION(Dan @ mercredi 09 juin 2004, 08:15)
Même si les é s'affichent de la même manière que les &eacute; , Google ne les référencie pas toujours de la même manière.

Une question sans doute sans réponse possible : as-tu remarqué une différence selon le charset choisi ? la manière de le spécifier (HTTP, meta...) ?
Sylvain Trovalet
j'utilise:
CODE
charset=iso-8859-15

surtout pour le caractère euro mais également pour le oe collé ou ligaturé, sinon il faut faire un tour du côté de l'unicode (UTF-8) je crois.
Anubis
CITATION(Dan @ mercredi 09 juin 2004, 07:15)
Même si les é s'affichent de la même manière que les &eacute; , Google ne les référencie pas toujours de la même manière.

La meilleure manière de sortir à l'identique pour "référencement" et "referencement" (sans accents) est encore d'utiliser les &eacute; dans la page.

Google ne connait pas que les entités ASCII, il connait aussi l'ISO-8859-1 et l'UTF-8. Pour ce qui est des autres charsets, il ne les connais pas, tout simplement.

En ce qui concerne la liste des entités, le mieux reste encore de chercher son caractère dans les tables d'unicode.org et de placer le caractère sous la forme en incluant le code hexadécimal du caractère. De toute manière, les entités ne sont que des mots associés à ces entités Unicode quelque part dans le navigateur.

ÉDITION: Ah bah justement Sylvain, l'ISO-8859-15 fait partie des charsets qui ne sont pas reconnus par Google. Voir http://www.psydk.org/ar_2004-03.php#n72 pour plus d'informations
Ceci est une version "bas débit" de notre forum. Pour voir la version complète avec plus d'information, la mise en page et les images, veuillez cliquer ici.