Aller au contenu

FrancoisParmentier

Membre
  • Compteur de contenus

    8
  • Inscrit(e) le

  • Dernière visite

Réputation sur la communauté

0 Neutre

À propos de FrancoisParmentier

  • Date de naissance 24/07/1969

Pour me contacter

  • Mon Site
    http://francois.parmentier.free.fr/

Information du profil

  • Genre
    Homme
  • Localisation
    Richardménil
  1. J'ai trouvé que cet article de Padawan résumait assez bien mon sentiment, et de façon bien argumentée.
  2. Certes. Ca marche. Mais tu dépends du moteur de recherche aussi. S'il reconnaît toutes les URL, même s'il n'y a pas de lien... (je ne dis pas que ça existe, je dis que c'est possible). En utilisant un service du genre tinyurl, tu deviens tributaire d'un autre site, ce qui est acceptable pour une information qui n'est pas destinée à durer, mais si tu veux un lien pérenne, il y a toujours un risque (mais c'est un autre débat). En gros: ça réclame (je trouve) plus d'efforts (tinyurl) et ce n'est pas mieux; sinon, ça réclame plus d'efforts au lecteur du site (copier-coller, et pas simple clic).
  3. Qu'entends-tu par "traiter"? Enfin, surtout: traiter par qui? Si c'est du CMS que tu parles, c'est simple à faire (d'ailleurs DotClear l'a intégré en un clin d'oeil). Si c'est du moteur de recherche, ça fait beaucoup de boulot (même s'il y a moins de CMS que de blogs, ça reste un nombre considérable), tributaire d'un template, d'un changement de structure en changeant de version... je trouve que le coup du nofollow est plus propre (et en plus, à ne traiter qu'une fois). Sur certaines plate-formes communautaires, comme Joueb.com, la plupart des commentaires viennent de gens identifiés, là, pas de problème: les gens identifiés peuvent mettre des liens normaux. Les autres se contentent d'un nofollow (enfin, c'est comme ça que je vois les choses, elles ne sont peut-être pas ainsi pour le moment). Du coup, même les blogs "homemade" peuvent gérer ça. Je suis d'accord que le gros inconvénient c'est qu'il s'agit d'un élément de plus à intégrer quand on écrit son HTML...
  4. Stephane> A mon avis, le plus gros problème, c'est déjà de déterminé sur quel type de page on est. Savoir qu'on est sur un blog n'est pas évident. Oula: même problème. Comment tu sais que tu es dans un guestbook et pas dans un annuaire? Automatiquement, je veux dire. Effectivement, sur un site particulier, on peut trouver des heuristiques pour contourner le problème du spam. Mais en général, le faire sans se tromper sur tous les sites possibles et imaginables... ça me paraît un peu utopique. Sebastien> Sauf si tu critiques un site. Tu n'as pas forcément envie de citer tout le contenu d'un site que tu trouves mauvais (sur n'importe quel plan). Donc tu fais un lien. Et là, par défaut tu le fais profiter de ton PageRank! Dommage. Ca pourrait être une autre utilisation de cet attribut: attention, je fais un lien, mais je ne cautionne pas le site qui est derrière!
  5. Pour moi, en ce moment, ce serait plutôt SVG, XHTML, CSS (mais SVG en premier), voire Python.
  6. C'était encore plus dommage avant qu'ils changent les serveurs MySQL (au bout de plus de 10 minutes d'attente, on avait un time out). Je ne sais pas si tu es allé voir mes notes techniques, je n'ai pas vraiment expliqué comment ça marche, c'étaient plutôt des notes pour moi, avant l'implémentation, mais on peut y trouver quelques principes. Pour simplifier, le modèle est ce que j'appelle, dans ma thèse, un Réseau de Concepts, qui est une sorte de réseau de neurones entièrement connecté, mais dont les noeuds représentent des information symboliques (si tu veux en voir un exemple, jette un oeil aux noeuds du Réseau de Concepts d'ECTOR. En gros, l'idée c'est de propager des activations parmi un réseau composé de tokens, de noms de personnes, d'expressions, puis de reconstruire une phrase à partir des noeuds les plus activés. Les liens entre les noeuds sont pondérés par un indice d'inclusion, qui ressemble en gros à une probabilité conditionnelle (sachant qu'on a un mot, quelle est la probabilité qu'il soit suivi de cet autre mot?), et que j'ai appelé l'influence d'un noeud sur un autre. L'originalité, c'est aussi la construction d'expressions (ou concepts) à partir des tokens. Quand, par exemple, on rencontre souvent "réseau" puis "de" puis "neurones", on peut penser à construire le noeud "réseau de neurones", afin d'éviter de construire des phrases contenant "réseau", suivi de "de", suivi de quoi que ce soit dont la probabilité de venir après ce mot soit importante, comme "manger"... Voilà voilà. A l'origine, l'idée du Réseau de Concepts vient du Slipnet de Copycat (une thèse de Melanie Mitchell, dont le directeur était Douglas Hofstadter). Toujours intéressé par une discussion plus poussée. J'espère que je ne suis pas trop technique (je n'ai pas trop l'habitude de vulgariser, mais ça tombe bien: je préfère le faire en français). Sinon, tu peux toujours aller voir ce que j'ai écrit sur le CraoWiki à propos d'ECTOR, ou bien dans mon blog. Edition: je n'ai pas répondu à la question sur ce que j'ai fait pour en arriver là. J'ai fait une thèse sur la reconnaissance automatique des champs dans les références bibliographiques à la fin des articles scientifiques. Mais j'imagine que tu as déjà dû t'en rendre en compte si tu as suivi les liens précédents (et exploré un peu). Au plaisir.
  7. C'est toujours un plaisir de partager (il faut juste avoir le temps et l'énergie pour ça ). Merci pour la bienvenue (et pour l'invitation, d'ailleurs).
  8. Bonjour, je m'appelle François Parmentier (tiens? étonnant!) Ca fait un bout de temps que je connais le web (j'ai une page personnelle depuis 1993). Ma page personnelle historique est hébergée chez Free: http://francois.parmentier.free.fr/ sur laquelle j'ai développé, en PHP/MySQL, un chatterbot (ou bot parlant), que j'ai appelé ECTOR. J'ai créé un projet SourceForge pour lui (occasion de créer une petite page avec des CSS): http://ector.sourceforge.net/ Professionnellement, je travaille entre autres sur un projet de boîte à outils UNIX nommée DILIB, dont les pages web ont été conçues il y a quelques années (voire une dizaine d'années). Un jour, quand j'aurai le temps, je reverrai ça http://dilib.inist.fr/ Cette boîte à outils permet entre autre de créer des "serveurs d'investigation" pour parcourir un corpus de notices bibliographiques plus facilement (un ensemble de CGI-BINs). Je travaille actuellement sur la réécriture de ces CGI en PHP (avec un passage à XHTML/CSS)... Exemple de serveur d'investigation: http://dilib.inist.fr/dilib/LocalDemos/Pub...ULTI.index.html Je gère le serveur web, et ses statistiques... c'est une nouveauté pour moi. J'ai depuis réutilisé DILIB (en tant que bibliothèque C permettant de manipuler du XML, et donc des arbres, facilement) pour réécrire ECTOR en C. J'ai créé une page PHP pouvant appeler cECTOR... mais je n'ai pas envie de me payer un hébergement pour ce fichier exécutable... Et pour finir: j'ai un blog, appelé Tout est relatif! http://hachis.joueb.com/
×
×
  • Créer...