Aller au contenu

Convertisseurs HTML automatiques


Denis

Sujets conseillés

Bonjour tout le monde,

J'ai une cliente qui aimerait utiliser un logiciel pour convertir ses documents texte en HTML (surtout pour faire de la conversion de tableaux de données, comme dans des rapports annuels, mais aussi des paragraphes de texte) afin de pouvoir les intégrer sur son site via un CMS. La personne en question n'est pas du tout technique et a donc besoin d'un outil du genre "fingers in the nose", qui ferait tout pour elle. Jusqu'à présent, elle utilisait un logiciel nommé "Adaptable", qui semble t-il, ne répond plus trop à ses besoins.

Comme la solution de conversion HTML dans Word est hors de question, parce que purement et propriétairement abominable et que les solutions plus techniques sont à proscrire, je me tourne vers vous pour un peu d'éclairage. En connaissez-vous un qui est recommandable ? Je ne parle même pas ici d'un logiciel qui respecterait les standards et l'accessibilité (je ne crois plus au Père Noël), mais simplement un logiciel qui saloperait moins le code que Microsoft Word. :yuk:

Merci d'avance pour vos réponses.

Lien vers le commentaire
Partager sur d’autres sites

Guest CraJK

Bin je ne vois pas alors pourquoi elle n'utilise pas word (JUSTEMENT) ou excel (tableu en entreprise) voir même publisher.....

Lien vers le commentaire
Partager sur d’autres sites

Comme la solution de conversion HTML dans Word est hors de question, parce que purement et propriétairement abominable et que les solutions plus techniques sont à proscrire, je me tourne vers vous pour un peu d'éclairage. En connaissez-vous un qui est recommandable ? Je ne parle même pas ici d'un logiciel qui respecterait les standards et l'accessibilité (je ne crois plus au Père Noël), mais simplement un logiciel qui saloperait moins le code que Microsoft Word. :yuk:

Si elle connait MS Word, il existe un add-on pour Word qui nettoie le code HTML produit par celui-ci. Le résultat n'est pas valide, mais représente déjà un énorme progrès.

Sinon, pourquoi pas OpenOffice ?

Lien vers le commentaire
Partager sur d’autres sites

Bin je ne vois pas alors pourquoi elle n'utilise pas word (JUSTEMENT) ou excel (tableu en entreprise) voir même publisher.....

Est-ce que tu as déjà regardé de quoi avait l'air un document HTML produit directement par la conversion dans Word ? Fais le test et tu comprendras tout de suite pourquoi ça ne m'intéresse pas du tout comme solution ! ^_^

Lien vers le commentaire
Partager sur d’autres sites

Si elle connait MS Word, il existe un add-on pour Word qui nettoie le code HTML produit par celui-ci. Le résultat n'est pas valide, mais représente déjà un énorme progrès.

Sinon, pourquoi pas OpenOffice ?

Voilà plus d'une journée que j'ai reçu ta réponse et je me flagelle toujours de ne pas y avoir pensé moi-même... j'ai fait quelques tests et le résultat est fort impressionnant. Pas parfait certes, mais autrement plus propre que la compétition de Redmond.

Merci de m'avoir sonné la cloche, c'est ce que j'ai recommandé à ma cliente. :thumbup:

Je ne peux évidemment pas remettre les documents en circulation pour vous le démontrer (entente de confidentialité oblige), mais sachez simplement que pour le même document texte, Word produit un document HTML de 1,2 megs et qu'OpenOffice produit un document de... 391 ko. Soit 4 fois plus léger ou si vous préférez, avec 4 fois moins de junk aussi propriétaire qu'inutile..

Qui plus est, et c'est loin d'être un fait anodin, OpenOffice me génère un fichier HTML comportant 38 erreurs selon le doctype HTML 4.01 transitionnel présent. 38 erreurs c'est déjà beaucoup trop, mais c'est vraiment satisfaisant pour un outil automatisé quand on considère que Word lui, me créé le même fichier avec pas moins de 2776 erreurs... en plus de ne pas inclure de doctype :wacko:

Alors, évidemment, entre Word ou OpenOffice, le choix n'est pas difficile à faire.

Lien vers le commentaire
Partager sur d’autres sites

Bonjour,

Je savais bien sûr que le code produit par Word était une véritable catastrophe, j'ai déjà examiné quelques pages pour tenter d'aider leur auteur (mission quasi impossible :( ) mais je n'avais jamais eu l'occasion de lire des chiffres comparant les deux traitements de texte...

c'est tout bonnement effarant !

Lien vers le commentaire
Partager sur d’autres sites

Guest CraJK

Je pensais que dreamweaver nettoyer aussi le code de word mais je n'ai jamais utilisé, il faudra que je le fasse un de ces 4.

Lien vers le commentaire
Partager sur d’autres sites

Ah, je suis allé fouiller dans mes archives du temps où j'utilisais Word :

Microsoft diffusait un Office 2000 HTML Filter 2.0, que l'on peut compléter avec un petit coup de Bersoft Word HTML CleanUp 1.0 ou de Textism Word HTML Cleaner, ou encore de Word Cleaner...

Pour info, HTML-Kit possède également une fonction "Strip surplus tags in Word 2000 Pages".

Enfin, pour OpenOffice, voir dans OpenOffice.org XML File Format Filters and Transformations, ainsi que soffice2html. Ou encore la version OpenOffice.org Developer Build 1.9.m49 supposée gérer l'export en xhtml 1.0 strict valide...

Lien vers le commentaire
Partager sur d’autres sites

Sinon, et si le serveur et le cms le permettent (ce qui n'est pas gagné), il y a toujours moyen de passer un petit coup de tidy sur le fichier uploadé, via un petit hack du cms.

Lien vers le commentaire
Partager sur d’autres sites

Merci pour ces informations supplémentaires les copains. Elles sont effectivement pertinentes pour l'histoire, mais je vous rapelle que dans le cadre de ma question, il s'agit d'offrir une solution de base - lam oins pire - pour un utilisateur 100% inexpérimenté et qui ne désire pas le devenir. Les modules d'extension ou autres trucs du genre sont donc à écarter lorsque le simple fait de démarrer un logiciel et sauvegarder en HTML est complexe en soit. ;)

Lien vers le commentaire
Partager sur d’autres sites

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...