CITATION(jpv @ lundi 24 janvier 2005, 13h19)
La pertinence n'est pas une valeur quantitative, ramener le plus grand nombre de résultats, mais qualitative, le moins de résultat mais les plus pertinents.
Tu cites le terme de contexte, et c'est justement un des grands problèmes des moteurs que de pouvoir évaluer le contexte de ce qu'ils indexent.
Concrètement, que signifie pertinent, à l'heure actuelle, pour Google ? Ca signifie tout simplement "similaire à la requête + populaire", et on espère que ça va devenir "similaire à la requête + populaire parmi les intervenants du secteur". Pour répondre à ce que tu dis plus bas :
CITATION(jpv @ lundi 24 janvier 2005, 13h19)
Quand on dit que les pages dont la structure et le balisage est normalisé réagissent mieux sur les crawls des moteurs, cela ne veut pas dire qu'elles seront mieux placées, mais que les algos des moteurs bénéficieront d'un matériel de meilleur qualité , d'un meilleur étalonnage et par exemple en s'appuyant sur une hiérarchie de titre pouvoir mieux pondérer l'indexation ce qui aura pour conséquence d'accroitre le potentiel discriminant des requêtes sur ces pages.
Je ne vois pas en quoi le fait que le marquage d'une page soit correct ou non la rend plus similaire ou plus populaire et donc constitue un "matériel de meilleure qualité" pour un moteur

Au contraire d'un détournement de balise par exemple, qui peut avoir pour effet de placer des mots-clés (similaires à la requête) aux bons endroits.
CITATION(jpv @ lundi 24 janvier 2005, 13h19)
C'est en ce sens que l'effort est important, pas pour se fondre dans une "pensée unique" dictée par je ne sais quelle mystérieuse entité, mais simplement pour élever la qualité purement technique du matériel à disposition des moteurs.
D'accord. Alors voici. Le W3C met des outils à notre disposition. J'ai lu cent fois qu'il se contentait de ça. Hélas, quand on a le malheur d'user de ces outils dans un but divergeant de celui du W3C, on se fait apostropher par les spécialistes de la chose. Encore une fois, il n'y a pas besoin de faire d'analyse très poussée pour se rendre compte que les
buts du W3C reflètent une vision parfaitement américaine du monde et de la façon dont les gens doivent penser.
Nous en sommes donc là : nous pouvons user des outils à condition d'en respecter l'esprit dans lequel ils ont été conçus. Sinon, c'est "mal". Le W3C ne met pas seulement des outils à notre disposition, il met des outils et y ajoute ses intentions et ceux qui ne respectent pas ces intentions sont des méchants (escrocs, tricheurs, etc). Comment diable peux-tu ne voir que la "qualité technique" de ces outils (que je ne conteste pas) et occulter le reste ???
CITATION(jpv @ lundi 24 janvier 2005, 13h19)
Pour un moteur de recherche, vouloir orienter ses résultats dans un sens ou dans un autre serait suicidaire.
Je veux dire que le jour ou sera démontré que google oriente ses résultats il y à fort à craindre que son utilisation décroisse rapidement.
Quel serait ta réaction si tu savais ça ? tu continuerais d'utiliser google ?
Je n'ai pas encore vu, dans l'histoire des médias, de support acquérir du pouvoir et de l'influence et ne pas s'en servir, tout simplement. D'abord ça peut leur rapporter, ensuite, sans qu'il soit question de "complot", un support à succès et/ou à position dominante devient très vite l'objet d'enjeux qui le dépassent. La neutralité dans ce contexte, je n'y crois pas une seconde, sans qu'il soit question de "complot ourdi par des superpuissances".
CITATION(jpv @ lundi 24 janvier 2005, 13h19)
Encore une fois je prends le contre-pied de ta remarque, c'est à l'heure actuelle que l'information cachée et pourtant très pertinente est difficile à atteindre.
Une thèse isolée et archivée dans un serveur web d'université, n'à aucune chance à l'heure actuelle de sortir en bonne place sur une liste de résultat.
Elle sera systématiquement supplantée par des études ou des ouvrages, le plus souvent payant, parce que son éditeur aura sus trouvé l'expert capable de le positionner, quitte à utiliser les failles du système.
Maintenant, dans un cadre normatif, où tout le monde (je suis un grand rêveur) respectent ces normes qui sont plus du domaine du bien commun que de l'injonction réglementaire, cette thèse aura de bien meilleures chances de sortir sur une liste de résultat.
Très théorique, ton exemple. Celui qui a l'éducation nécessaire pour tirer parti de la lecture d'une thèse d'université sait aussi la trouver sans passer par un moteur de recherche. De plus, ce n'est pas le cas de la majorité des gens, normal qu'un moteur propose des résultats censés plaire à la majorité de ses utilisateurs. Je ne vois pas bien en quoi il est intéressant qu'une thèse le plus souvent imbitable prenne la place d'une information vulgarisée sur le domaine, même si cette dernière est payante.
CITATION(jpv @ lundi 24 janvier 2005, 13h19)
Toute ces remarques ne concernant que ce thème des standards et du référencement, parceque utiliser à mauvais escient le balisage diminue l'accessibilité du contenu et ça c'est, encore un autre débat.
Cent pour cent d'accord (sur le fait que c'est un autre débat).
Ganf, si nous poursuivons notre discussion, nous plongeons hors sujet. Je t'ai donc fait un petit mp
Sur la suite : standards et moteurs. Il y a deux parties. Quand vous parlez des professionnels, de l'évolution de vos métiers, tout ça, je m'en mêle pas : je ne suis pas plus concerné que compétent et si vous dites que les standards représentent un progrès fabuleux pour vos activités, je vous crois volontiers sur parole.
Mais quand vous parlez de grand public, où voyez-vous de l'évolution au sujet des standards ? L'évolution, (la grande révolution, même !), elle a déjà eu lieu : n'importe qui peut, au prix d'un moindre effort, produire un document qui, même codé de travers, peut être lu et compris par n'importe qui d'autre sur un ordinateur. Ca, c'est un vrai changement. Et elle est pas géniale, cette idée ? Mieux même, ces pages faites n'importe comment sont indexées et classées au même titre que les pages bien chiadées et bien léchées par les balèzes. De mon côté, je trouve ça sensationnel et... vous avez l'air de dire qu'il faut que ça change ? Que les moteurs devraient privilégier VOS pages ? Et pourquoi pas les miennes, mmmh ? surtout que vu que c'est les miennes, elles sont bien plus intéressantes pour la planète que les vôtres, n'est-ce pas évident ?
Le discours visant à expliquer que les seules pages valables qui devraient être privilégiées par les moteurs sont celles qui sont faites dans les règles de l'art, mille pardons, mais je trouve que c'est un retour en arrière, un retour à l'époque ou il était quasi-impossible de communiquer sans faire appel à trente compétences de professionnels, quel que soit le support choisi.
Donc les pros, vous codez comme vous voulez en pinaillant sur les mérites comparés du <strong> et du <b>, vous pouvez même ricaner entre vous à la lecture de pages bancales montées par d'autres moins velus que vous en la matière, mais quand vous avez l'air de déplorer le fait que vos mérites ne sont pas suffisamment reconnus par les moteurs, là, je trouve que vous exagérez un peu
Un autre point sur les standards : ce type de débat a déjà eu lieu à l'apparition de la PAO, ces réflexions, je les connais par coeur. Les arts graphiques ne fonctionnent d'ailleurs qu'avec des formats propriétaires (au hasard : le Postscript). Ca a des inconvénients. Ca a aussi des avantages : graphiquement, nous avons progressé à mort, nous sommes baignés d'images d'une immense qualité par rapport à il y a vingt ans. Pensez-vous que de tels progrès auraient pu avoir lieu dans d'autres conditions ? Si oui, quels sont vos arguments ?
A vous lire