Jump to content
Sign in to follow this  
oxyd-x

charset iso-8859-xx, utf-xx

Recommended Posts

Salut,

pour les besoins d'un de mes scripts, j'aimerais savoir si il est possible de convertir un texte d'un charset à un autre;

puisque un exemple vaut mieux que mille explications ;) ::

brut : je suis un test à accents
utf-xx : je suis un test à  accents
iso-8859-xx : je suis un test à accents

je voudrais donc pouvoir convertir n'importe lequel de ces trois formats en texte brut (ou binarisé en utf par exemple) en sachant que je ne peut pas enlever les balises html;

- donc, sans htmlentites (qui bloque mes balises);

merci à tous ;)

Share this post


Link to post
Share on other sites

Tu as les fonctions suivantes:

utf8_decode -- Convertit une chaîne UTF-8 en ISO-8859-1

string utf8_decode ( string data )

utf8_encode -- Convertit une chaîne ISO-8859-1 en UTF-8

string utf8_encode ( string data )

qui te permettent déjà les conversions de UTF-8 en ISO et vice-versa.

Pour info, à n'est pas de l'iso, c'est simplement un token HTML qui peut tout aussi bien fonctionner dans une page avec un charset UTF-8 :)

Share this post


Link to post
Share on other sites

Ce que tu appelles brut est sûrement de l'ISO-8859-1 (ou du windows-1252, dans ce cas, les conversions seraient plus problématiques).

Ce que tu appelles utf-xx est utf-8.

Ce que tu appelles iso-8859-xx semble être de l'ascii avec des entités html (truc vraiment sans intérêt).

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
Sign in to follow this  

×
×
  • Create New...