Version complète: sur le forum Webmaster Hub : Augmenter la "densité de mots clé" ne dope pas le référencement
Webmaster Hub > Promotion de Sites Internet > Techniques de Référencement
Pages: 1, 2
Cariboo
Citation d'un échange sur google groups

CITATION(Adam Lasnik)
John's absolutely correct. "Write naturally."
[...]
And I'll let you in on a little algo secret: There is no single magic
number. People who say "The guaranteed optimal keyword density is
[x]%" would ideally meet the same fate from an angry English teacher.
Or Googler or Webmaster.
[...]
"


Traduction : John a complètement raison : écrivez naturellement

Et je vais vous faire partager un petit secret sur l'algo. Il n'y a pas un seul nombre magique. Les gens qui annoncent que "la densité optimale recommandée est de X% connaîtront le même sort de la part de leur professeur de français, d'un Googler ou d'un Webmaster. [à savoir qu'ils se feront taper sur les doigts pour avoir fait trop de répétitions]

C'est un point que je répète régulièrement. Les moteurs de recherche font un usage immodéré de la linguistique statistique dans leurs algorithmes, ce qui veut dire que s'éloigner de la norme a des conséquences pénalisantes en général en terme de référencement. Une densité anormale peut éloigner un document de la similarité maximale avec une page donnée, voire déclencher un filtre qui va détecter une suroptimisation.

En tout état de cause, le critère de densité par mots clé est tout sauf pertinent, car les statistiques sur le corpus (toutes les pages de l'index) sont tout aussi importantes pour savoir si une page peut oui ou non sortir en bonne position sur une requête donnée.

Le problème c'est qu'en même temps, il y'a forcément une corrélation nette entre densité de mots clés et bon positionnement, mais c'est un "effet de bord" et non la cause.

(Adam Lasnik est ingénieur chez Google, et travaille dans l'équipe de Matt Cutts)
lafleur
Salut Cariboo smile.gif

CITATION(Cariboo @ vendredi 26 janvier 2007, 08h56) *
Les moteurs de recherche font un usage immodéré de la linguistique statistique dans leurs algorithmes, ce qui veut dire que s'éloigner de la norme a des conséquences pénalisantes en général en terme de référencement. Une densité anormale peut éloigner un document de la similarité maximale avec une page donnée, voire déclencher un filtre qui va détecter une suroptimisation.


(c'est moi qui mets en gras)

Là, y un truc que j'ai jamais capté entre l'info que tu donnes (que je ne mets pas en cause) et la conclusion que tu en tires (qui me laisse perplexe).

Faux ou pas, le principe de l'importance de la densité en mots-clés est quasiment unanimement partagé. Résultat : dans certaines thématiques, la plupart des pages qui montent un brin dans les résultats ont une densité élevée de mots-clés.

Ne pas atteindre cette densité revient alors à s'éloigner de la norme, donc à se manger une pénalité. smartass.gif

Donc la densité optimale de mots-clés est à évaluer (en analysant les pages des autres) et à prendre en compte. Si ce n'est pas la densité, c'est le nombre de mots-clés dans la page, bref, ne pinaillons pas là-dessus laugh.gif

Mais tu dis
CITATION(Cariboo @ vendredi 26 janvier 2007, 08h56) *
le critère de densité par mots clé est tout sauf pertinent


Si je suis d'accord sur le fait qu'écrire naturellement est la meilleure solution, je ne vois pas comment ta conclusion découle de ton raisonnement. Il doit donc manquer quelque chose à mon raisonnement... mais quoi ?

De plus, le critère me semble pertinent puisqu'il peut être selon toi facteur de déclassement : il est donc bien pris en compte dans l'algo. Il faut donc tout de même y prêter attention, ne serait-ce que pour ne pas se faire plomber ?

A te lire wink.gif
captain_torche
Si j'ai bien compris, ce n'est pas la densité de mots-clés (correspondant tous à une même thématique) en général qui est ciblée, mais la répétition de mots-clés identiques (pour "optimiser la page sur la requête correspondante"), qui serait pénalisée.
lafleur
Captain Torche, c'est bien la densité qui est en question :

CITATION(Cariboo @ vendredi 26 janvier 2007, 08h56) *
Une densité anormale peut éloigner un document de la similarité maximale avec une page donnée, voire déclencher un filtre qui va détecter une suroptimisation.
Sebastien
CITATION
Ne pas atteindre cette densité revient alors à s'éloigner de la norme, donc à se manger une pénalité.


Etre en dessous de la norme c'est ne pas être pertinent. Etre au milieu de la norme c'est être moyen. Etre dans le haut de la norme c'est être éventuellement jugé plus pertinent. Etre au dela de la norme c'est être suspect wink.gif

Je suis à 100% d'accord avec l'interprétation de Cariboo et vous renvoie à cet ancien billet : http://s.billard.free.fr/referencement/ind...e-des-mots-cles
Patrick
Salut,

je rejoins les conclusions de Cariboo. La répétition anormale (je parle de grammaticalement ou linguistiquement) de mots est plus pénalisante chez Google que bienfaisante. Il faut écrire pour les lecteurs et non pour les moteurs : c'est là le secret de la réussite sur Google.

Maintenant, la densité de mots clés n'est pas à placer aux oubliettes non plus. La densité des mots clés pour des outils comme Voià, Live et Yahoo à son importance. Faut il alors optimiser des pages pour les internautes (donc Goolge) et d'autres pour les autres outils ? A vous de voir mais je dirais oui ... pour l'instant en tout cas, les algo des autres moteurs sont également susceptibles de donner moins d'importance à la densité qu'ils ne le font encore aujourd'hui.

++

Patrick
lafleur
Je précise : je ne fais moi-même pas du tout attention à la densité d'un ou de plusieurs mots quand je mets une page en ligne cool.gif

Ce que je veux dire, c'est que si j'ai compris quelque chose au premier post (ce qui est, j'en conviens hélas, pas sûr du tout sad.gif ), si sur une thématique on observe une densité moyenne élevée de mots-clés dans les pages existantes et bien classées, ne pas atteindre cette densité (donc s'éloigner de la norme) est pénalisant.

Et que dans ce cas, il est bon de l'augmenter, donc éventuellement de retoucher un texte écrit naturellement pour le doper.

Ce qui, théoriquement, ne devrait pas être bon... Je suis un peu perdu laugh.gif
Sebastien
La norme s'établit sur l'ensemble du web, pas sur une thématique. En gros on établit une courbe de distribution de la densité et on définit une fourchette de normalité. En dessous de la fourchette c'est du manque de pertinence, au dessus c'est probablement du spam.
Leonick
CITATION(Sebastien @ vendredi 26 janvier 2007, 09h57) *
La norme s'établit sur l'ensemble du web, pas sur une thématique. En gros on établit une courbe de distribution de la densité et on définit une fourchette de normalité. En dessous de la fourchette c'est du manque de pertinence, au dessus c'est probablement du spam.
Comme le but est de faire des pages pour les visiteurs et pas que pour les moteurs, il ne serait pas surprenant qu'ils prennent leur "normalité" non sur le web, mais off-line, sur des revues, livres, etc... l'OCR étant très pratique. smartass.gif
lafleur
Oui, le principe global, c'est assez clair (enfin je crois).

Mais au final, la norme s'établit forcément sur une thématique, car les pages hors thématique contiennent peu ou pas le mot-clé en question (peu de pages sur les boulons contiennent le mot banane par exemple), donc sauf si j'ai pas capté un truc les pages hors thématique ne sont pas prises en compte.

De plus, une "fourchette de normalité" ça veut dire une densité optimale (la meilleure possible), et ça Cariboo dit que ça n'existe pas sad.gif

Ou plutôt, il dit "Il n'y a pas un seul nombre magique", donc il y en a plusieurs.

Un par thématique ? laugh.gif
Jeff
J’ai l’impression que Cariboo parle de la densité comme moi je parle du PR quand je dis : je me cite (Le PR ça ne sert à rien).

La densité a une incidence mais je crois que cela est plus une recette de grand-mère à adapter à chacun des sites et à leur thématique.

La densité d’un mot clé est à mesurer sur le contrôle d’un site qui aura été fait pour les moteurs de recherche afin de se positionner sur un mot clé. On se trouve en principe dans ce cas avec un site sur optimisé, il faut donc mesurer les occurrences et déterminer le % correct.

Il n’y a qu’à ramener cette densité à 0 (pour un groupe de mots clés) pour voir les difficultés à acquérir du trafic sur la thématique.

Je ne dis pas qu’il faut absolument mesurer l’occurrence d’un mot clé mais voir si les mots ne sont pas mélangés dans plusieurs thématiques et veiller à ce que leur poids ne soit pas démesuré par rapport au site :

Chaque mot a un poids sur une page et il peut être positif ou négatif mais pour déterminer quel filtre s’applique à la page ou au site (filtre ne veut pas dire pénalité) le moteur mesure tout un tas d’autres éléments grâce à son algo.
Pour exprimer mon sentiment, je dirai que pour déterminer le poids d’un mot clé dans une page le moteur aurait besoin de :

- Mesurer le nombre de requêtes effectuées sur ce mot ou groupe de mots dans son moteur.
- Mesurer le nombre de pages du site
- Mesurer les thématiques abordées par le site
- Mesurer la position et le nombre de mots dans la page (title, desc, Hxx, contenus etc .. )
- Mesurer l’indice de popularité (Le PR et oui on y revient)
- Etc. ...

Pour conclure ma vision des choses je dirai :

On doit mesurer la densité pour être honnête pas pour le contraire ; de là à dire qu’elle ne sert à rien j’en suis pas si sûr !!

Jeff,
Leonick
Pour moi, la densité devrait s'analyser en faisant abstraction de notre côté webmaster et en se demandant si notre page (ou site) nous paraitrait normale sur du off-line, dans un magazine par exemple. Ou si on se dirait "c'est quoi son article tout nul, il me répète 3 fois les mêmes choses" wink.gif
karnabal
CITATION
il ne serait pas surprenant qu'ils prennent leur "normalité" non sur le web, mais off-line, sur des revues, livres, etc... l'OCR étant très pratique.

Je trouve l'hypothèse intéressante.

J'ai volontairement joué la carte de la densité (site en signature, sur une ou deux expressions clés par pages, avec des taux compris entre 2,5 et 5%). Même si mon texte est truffé de mots-clés je doute franchement

Dans quelques mois je pense que je changerais de stratégie, mais au préalable je compte bien procéder à un test sur quelques une de mes pages. Je tâcherais d'en rendre compte sur le Hub. wink.gif
lafleur
Trop compliqué pour moi ton truc Jeff tongue.gif

Je vais continuer à ne pas m'occuper du poids des mots-clés dans mes pages et reoublier ces histoires de densité : quitte à perdre un peu de trafic, je préfère publier des trucs en joli français (ou au contraire faire les répétitions nécessaires si le type de texte le demande, ce qui arrive) plutôt que de faire des contorsions pour coller à des hypothétiques chiffres idéaux.

Le référencement technique, c'est trop balèze pour moi laugh.gif
thick
Pour argumenter dans le sens de Cariboo, je citerais... Cariboo laugh.gif
En effet, c'est une légende urbaine du référencement que de se baser sur la densité de mots clés. Même si je dois contredire mes potes Jeff et Lafleur, il ne faut pas utiliser cet indice qui ne veut absolument rien dire pour moi. La densité de mots clés calcule le nombre de mots clés par rapport au contenu/longueur de la page . Or les moteurs calculent en terme d'occurences par rapport aux mots de la page (sans incidence sur la longueur de la page), aux mots des autres pages, aux mots de la page des concurrents sur la requête et aux autres pages des sites des concurrents sur la requête... et j'en passe. Il n'y a aucun outil aujourd'hui qui est capable de me sortir ce genre de stats.
Bref PageRank et densité c'est de la pure perte de temps :tongue.gif:
Cariboo
En fait, c'est le fait de potasser les méthodes statistiques utilisées par les linguistes qui m'a fait comprendre pourquoi, sans penser à des filtres sophistiqués, le "keyword stuffing" pouvait avoir des conséquences néfastes...

Un moteur cherche à déterminer, une requête étant donnée, un classement des pages les plus "pertinentes". Ce classement utilise différentes méthodes (calculs de distance=similarité, calculs probabilistes...) pour déterminer les pages les plus proches de la requête. De nombreux autres critères pondèrent ces résultats pour éviter que trop de pages ayant des notes proches soient fournies à la queue leu leu, ces critères complémentaires permettent donc d'améliorer la pertinence perçue par l'internaute.

Toutes les méthodes de calcul poursuivent le même objectif, donc les mêmes causes produisent les mêmes effets.

Si on prend la plus classique, et la plus intuitive (le cosinus de Salton), on definit un espace vectoriel à N dimensions (N étant égal à l'ensemble des termes signifiants présents dans le corpus (l'ensemble des pages web indexées), c'est à dire un nombre très grand).

Dans cet espace vectoriel, chaque axe permet de représenter la similarité par rapport à un terme. Un document est donc symbolisé dans ce modèle comme un vecteur dont l'orientation dans l'espace (ses coordonnées spatiales) définit (pour schématiser) son thème.

Une requête de quelques mots est elle aussi un document qui peut également être symbolisé par un vecteur dans l'espace vectoriel de Salton. Un simple calcul de distance permet de savoir quels sont les documents "proches" sémantiquement de la requête.

L'ajout d'un seul mot dans un document change subtilement l'orientation dans l'espace du document. L'ajout d'un paragraphe sur le même thème aura tendance à changer aussi l'orientation, mais globalement, l'orientation du vecteur dans l'espace restera identique, à peu de choses près... Le keyword stuffing par contre fait dévier le vecteur plus vite.

Or le problème, c'est que les coordonnées ne sont pas calculées uniquement par rapport à des infos statistiques sur le document et la requête, mais sur toutes les pages web !! Ce qui veut dire qu'en général, on ne connait pas les coordonnées de la requête dans cet espace là, donc le keyword stuffing peut tout aussi bien éloigner de la bonne position que s'en rapprocher. C'est ce que l'on observe empiriquement.

Avec ce modèle en tête, on se rend compte assez vite que le keyword stuffing marche par construction sur des requêtes à un ou deux termes, mais que cela devient plus aléatoire dès que l'on dépasse trois termes. Mal pensé, l'ajout de mots clés entraine généralement dans ce cas un impact négatif.

Or les requetes à trois mots et plus deviennent la norme... C'est pour cela que jouer sur la densité de mots clé devient une mauvaise idée.

Il faut ajouter que la proximité est avant tout une question d'"angle", mais que si on prend en compte le poids des termes (la longueur des vecteurs projeté sur chaque axe), alors tout dépend des autres critères de l'algo et de leur pondération. Il est clair que chez tous les moteurs grand public, un équilibre subtil existe entre les deux, ce qui permet à des documents qui ne possèdent pas l'expression recherchée répétée des dizaines de fois sur la page de sortir dans les premières positions.
thick
CITATION(Cariboo @ vendredi 26 janvier 2007, 19h29) *
Si on prend la plus classique, et la plus intuitive (le cosinus de Salton), on definit un espace vectoriel à N dimensions (N étant égal à l'ensemble des termes signifiants présents dans le corpus (l'ensemble des pages web indexées), c'est à dire un nombre très grand).


A force de t'entendre parler du cosinus de Salton je crois que j'ai trouvé ton nouveau surnom laugh.gif

CITATION(Cariboo @ vendredi 26 janvier 2007, 19h29) *
Il faut ajouter que la proximité est avant tout une question d'"angle", mais que si on prend en compte le poids des termes (la longueur des vecteurs projeté sur chaque axe), alors tout dépend des autres critères de l'algo et de leur pondération. Il est clair que chez tous les moteurs grand public, un équilibre subtil existe entre les deux, ce qui permet à des documents qui ne possèdent pas l'expression recherchée répétée des dizaines de fois sur la page de sortir dans les premières positions.

Pourquoi tu rapproches proximité et angle ? Peux-tu préciser stp ?
Régis
Bravo pour l'exposé Cariboo... mais certains points techniques (cosinus de Salton, etc...) sont au delà de mes connaissances actuelles.

La discussion sur la "thématique" m'a fait resurgir un souvenir...

A une réunion de Webmasters, un des membres m'avait exposé sa théorie sur la densité des mots.
Selon lui (je résume) :
GG se basait sur les rubriques de l'ODP pour définir une densité moyenne par rapport à une thématique donnée.
Donc, si "ta" densité était supérieure (pas trop supérieure) cela était favorable à un meilleur positionnement. A moduler, bien sûr, avec les autres paramètres de référencement et l'étude des sites en 1ères positions.
Cariboo
Dans ce modèle, deux vecteurs qui sont orientés de la même façon (ils ont donc un angle nul entre eux) représentent deux documents dont les coordonnées dans l'espace "sémantique" sont réparties de la même façon. Ce sont probablement des documents parlant d'un thème commun.

Par contre ces deux vecteurs n'ont pas forcément la même longueur... La projection de cette "longueur" sur chaque axe mesure le poids de chaque terme dans ce document.

Sauf qu'il y'a plusieurs manières de calculer le poids d'un terme dans un document. Mais en règle générale, on pondère le poids d'un terme dans un document donné par la fréquence des documents contenant ce terme. Ce qui permet d'éliminer le "bruit de fond" dû aux mots les plus courants.

Déjà, le fait de savoir cela permet de comprendre pourquoi la notion de densité normale est variable : elle varie d'un document à un autre, et d'une requête à une autre.

Le terme "globicéphale" est présent dans un faible nombre de documents rapporté au nombre de pages web. La présence de deux fois le terme globicéphale dans une page en fait un document pour lequel le poids "globicéphale" va être très important. Si on rajoute une fois baleine, et une fois cétacé, cela oriente la page dans une direction qui la fera "matcher" plutôt avec une requête sur les cétacés que sur autre chose. A l'inverse, la présence d'une seule occurrence du mot "web" sera quasiment sans effet, car le poids de ce terme va être jugé ridicule.

La longueur du vecteur permet de classer les documents entre eux. Le seul problème c'est qu'entre deux documents "orientés" de la même façon, celui qui a le vecteur le plus long n'est pas forcément le plus pertinent. C'est juste celui dont le poids des termes projeté dans une direction donnée est le plus élevé (cela fait longtemps qu'on ne confond plus similarité et pertinence)

Donc ceux qui fabriquent les moteurs de recherche ont appris à pondérer les critères liés au poids des termes avec d'autres critères (comme le pagerank, mais aussi tous les subtils critère "in page") qui eux sont là pour augmenter la pertinence des réponses telle qu'elle est attendue par l'internaute.

Bref pour résumer :

1°) Le keyword stuffing a plus ou moins d'effet en fonction de la requête ciblée. Cela dépend, non pas du caractère concurrentiel ou non de la requête, mais de la rareté ou non des documents contenant les termes ciblés (ceci dit, si la requête est concurrentielle, les pages contenant ces termes se multiplient rapidement)
2°) Dans la plupart des cas, les méthodes "bourrines" de keyword stuffing rendent la page moins pertinente sur les requêtes à plusieurs mots (dommage...). Les méthodes "scientifiques" étant par ailleurs plus difficiles à utiliser que la rédaction en langage naturel, cette dernière méthode est préférable. Je rappelle au passage que cela rend aussi vos sites plus intéressants

CITATION
il ne serait pas surprenant qu'ils prennent leur "normalité" non sur le web, mais off-line, sur des revues, livres, etc... l'OCR étant très pratique.


Et pourtant ! Non partir de statistiques faites à partir de la langue des livres donne des résultats terriblement mauvais sur le web.
Ce qui est analysé c'est bien le contenu des pages web indexées, pas autre chose.
lafleur
La densité d'un mot-clé est donc bel et bien un critère majeur du classement des pages dans les résultats.

Majeur au point que Google par exemple effectuerait des calculs statistiques sur l'ensemble de son index pour obtenir des densités optimales, afin, entre autres, de détecter les pages suroptimisées et de les pénaliser... ce qui revient à donner un bonus aux pages proches de la densité optimale (tout dépend si on regarde le verre à moitié vide ou à moitié plein).

Après en effet, on peut dire que nous ne pouvons pas connaître la densité optimale aux yeux de Google de telle ou telle occurrence, d'autant qu'elle doit changer sans cesse selon les nouveaux documents mis en ligne et analysés et que rédiger en langage naturel est une méthode rapide et efficace pour obtenir de bons résultats en termes de positionnement, sans même parler de l'internaute wink.gif

Ou bien à l'opposé nous pouvons faire quelques tests, en nous inspirant des pages bien classées sur une requête, pour essayer de déterminer empiriquement une fourchette de densités acceptables, en partant du principe par exemple que sur 30 pages bien classées, on peut supposer que 25 d'entre elles ont une densité située dans la bonne fourchette (les autres sont bien placées pour d'autres raisons) et donc en avoir une bonne idée. Avec de l'expérience et une bonne intuition, on doit pouvoir parvenir à de bons résultats comme ça.

Les deux méthodes ont leurs avantages et leurs inconvénients. En langage naturel, les rédacteurs ont leur style et celui-ci peut être pénalisé par un algo, pour dix mille raisons (un texte plein de métaphores ne doit pas être classé comme un texte plein d'exemples). Et savoir ce que veut dire "densité d'un mot dans une page" pour Google, avec tous les endroits d'une page qu'il doit pondérer hyper finement (présence dans des balises diverses) ne me paraît pas simple. Mais après tout, on peut reproduire et améliorer un mécanisme sans le connaître, comme on faisait du vin des millénaires avant même d'imaginer ce que peut être une molécule d'alcool laugh.gif
Cariboo
lol ! J'ai l'impression que tu m'as bien compris. Je vais juste préciser deux trois trucs pour éviter que tes formulations soient mal interprétées par d'autres.

CITATION
La densité d'un mot-clé est donc bel et bien un critère majeur du classement des pages dans les résultats.


Sauf que formulé comme cela et sorti du contexte, cela devient faux. Il ne s'agit pas d'une "densité", le terme est impropre et trop connoté, mais d'une fréquence. Et ce n'est pas "une" fréquence qui constitue le critère, mais l'ensemble des fréquences de tous les termes. Sans compter qu'il existe un ordre caché dans ces stats (de niveau 2) qui révèle les relations entre ces termes. Relation que l'on peut aussi prendre en compte au plus bas niveau en tenant compte de la distance entre les termes...

Bref, isoler dans le raisonnement la fréquence d'un seul terme conduit souvent à de fausses conclusions.

CITATION
Majeur au point que Google par exemple effectuerait des calculs statistiques sur l'ensemble de son index pour obtenir des densités optimales, afin, entre autres, de détecter les pages suroptimisées et de les pénaliser... ce qui revient à donner un bonus aux pages proches de la densité optimale (tout dépend si on regarde le verre à moitié vide ou à moitié plein).


Attention, tu as parfaitement raison, mais je ne crois pas que les suroptimisations soient détectées et prises en compte dans l'algo de base. Il me semble par contre facile de faire un filtre antispam sur ce genre de critères pour détecter des pages anormales et de les déclasser automatiquement (toujours le distinguo chez Google entre "filtre" et "algorithme de classement").

CITATION
Ou bien à l'opposé nous pouvons faire quelques tests, en nous inspirant des pages bien classées sur une requête, pour essayer de déterminer empiriquement une fourchette de densités acceptables, en partant du principe par exemple que sur 30 pages bien classées, on peut supposer que 25 d'entre elles ont une densité située dans la bonne fourchette (les autres sont bien placées pour d'autres raisons) et donc en avoir une bonne idée. Avec de l'expérience et une bonne intuition, on doit pouvoir parvenir à de bons résultats comme ça.


Etudier les 30 premiers résultats (plutôt les 100 d'ailleurs) en aspirant les snippets pour les triturer à grand coup d'outils de statistiques linguistiques permet effectivement d'en tirer des conclusions valables pour savoir comment doper une page de termes idoines avec le bon dosage pour arriver en tête des résultats.

Mais l'étude des densités seules ne donnera rien. Il faut étudier les taux de cooccurrence, et savoir utiliser la méthode.

Les expériences que j'ai menées m'ont montré que le jeu n'en valait pas la chandelle. Déjà il faut passer du temps pour acquérir l'expérience nécessaire pour utiliser les résultats intelligemment. Ensuite le fait de ne pas connaître suffisamment d'infos sur le corpus (l'index du moteur) fait que tout cela est approximatif. Et de toute façon, écrire en langage naturel est moins compliqué ...

CITATION
Et savoir ce que veut dire "densité d'un mot dans une page" pour Google, avec tous les endroits d'une page qu'il doit pondérer hyper finement (présence dans des balises diverses) ne me paraît pas simple.


Tu as raison, c'est bien le problème. Les critères "in page" changent radicalement le classement obtenu à partir du seul poids des termes, c'est ce qui rend vain un travail systématique sur la densité de mots clés.
thick
OK, peut-on faire marche arrière svp ?
A mon avis, il faut redonner une définition du terme "densité" tel qu'on l'emploie ici...
Pour moi, cela veut dire implique un rapport entre l'occurence d'un ou plusieurs mot(s) dans le contenu d'une page et le nombre total de mots de cette page.
Ainsi, je redis que (pour moi) l'indice de densité est une chimère du référencement car je n'ai jamais vu où un moteur calculait le rapport d'occurence par rapport à la longueur de la page...
A vous de me définir "densité".

Au lieu de densité, je parlerais plutôt d'occurences, ... mais plus jamais densité !!!
lafleur
Oulaaaaaaaaaaaaaaaah laugh.gif
CITATION(thick @ samedi 27 janvier 2007, 11h10) *
A mon avis, il faut redonner une définition du terme "densité" tel qu'on l'emploie ici...

Sans moi tongue.gif Je préfère garder "densité" au sens premier du Robert, avec tout le flou qui va autour car ce flou traduit parfaitement notre méconnaissance du fonctionnement de Google. Nous avons une idée des principes mais chacun se fait sa propre conviction sur ce que ça peut bien signifier exactement, histoire d'avoir une ligne directrice pour bosser !

Parce que si on commence à se lancer dans une recherche de rigueur et de précision, on va vite se demander ce que peut bien signifier exactement "langage naturel". A première vue, on pense qu'un texte en langage naturel est un texte qui n'est pas écrit pour le robot, mais pour l'internaute. Soit. Mais ça veut dire quoi ?

Un texte poétique est-il naturel ? Un texte qui colle à de strictes règles universitaires est-il naturel ? Un texte de vente (tu sais mieux que moi qu'on n'a pas attendu Google pour savoir que la répétition et la redondance sont indispensables dans un discours commercial) est-il naturel ? Un texte en sms est-il naturel ?

Je refuse donc d'aller trop loin dans l'analyse de la chose : je préfère largement me vautrer dans le flou et le pifométrique et choyer l'empirisme et l'intuition. A force de se planter, on arrive parfois à progresser cool.gif

Mais c'est quand même avec intérêt que je lirai les propos de ceux qui se lancent dans la réponse à ta question !
thick
Ben voilà mon cher Lafleur, j'ai bien le sentiment qu'on ne parlait pas tout à fait de la même chose wink.gif
Mon problème avec densité est surtout que ça implique la taille du corpus et ça je pense que c'est plonger dans le flou artistique lol
Cariboo
Ceci dit, en toute rigueur, rien n'interdit d'appeler densité le ratio nombre d'occurrences / nombre total de mots. Quand je parle de fréquence, c'est bien la même définition.

Dans la notion habituelle de densité (ou de fréquence des termes), la longueur du document n'est pas prise en compte. Un mot présent une fois dans un texte de 100 mots, aura la même fréquence qu'un mot présent deux fois dans un texte de 200 mots.

Quand je dis que je me méfie de l'appellation densité, je fais allusion aux connotations propre au monde du référencement pour ce terme, et aussi au parallèle malheureux fait avec la notion habituelle de densité (poids volumique / poids volumique). Parce que si on parle de "poids" des termes, cela devient autre chose, dans une mesure de type tf*idf, le poids est donné par la formule tf*idf, et ce que l'on appelle densité, n'est que tf.

CITATION
Parce que si on commence à se lancer dans une recherche de rigueur et de précision, on va vite se demander ce que peut bien signifier exactement "langage naturel". A première vue, on pense qu'un texte en langage naturel est un texte qui n'est pas écrit pour le robot, mais pour l'internaute. Soit. Mais ça veut dire quoi ?


En voila une question qu'elle est bonne smile.gif

Effectivement, comme toi, je pense que cette notion de "langage naturel" n'a plus beaucoup de sens, et en a de moins en moins avec le temps. Car plus le temps passe, plus les termes contenus dans les pages web y sont placés par des programmes ou proviennent de publicités, la part du contenu réellement 100% naturel diminue.

C'est d'ailleurs pour cela que le corpus constitué par les pages web est différent de ce que l'on trouve dans les livres, et que la "norme" du langage dans les pages web, n'est pas celle du Littré.

Donc quand Google nous dit "écrivez en langage naturel", ils font fi d'une réalité que pourtant ils connaissent bien. Et je ne parle même pas du spam. Il faudrait plutôt dire toujours "faites des pages pour les internautes, pas pour les moteurs", à la rigueur. Mais ça aussi c'est faire fi des enjeux, et des imperfections des moteurs.

CITATION
Mon problème avec densité est surtout que ça implique la taille du corpus et ça je pense que c'est plonger dans le flou artistique lol


Ca on est d'accord. Il y'a trop de paramètres inconnus qui parasitent les tentatives d'expérience, et une approche 100% scientifique du problème est impossible. Tout cela reste empirique. Le fait de savoir certaines choses permet juste d'éviter de se fourvoyer et de mieux voir la lune derrière le doigt qui l'indique.
Jeff
CITATION(Cariboo @ dimanche 28 janvier 2007, 13h06) *
Quand je dis que je me méfie de l'appellation densité, je fais allusion aux connotations propre au monde du référencement pour ce terme, et aussi au parallèle malheureux fait avec la notion habituelle de densité (poids volumique / poids volumique). Parce que si on parle de "poids" des termes, cela devient autre chose, dans une mesure de type tf*idf, le poids est donné par la formule tf*idf, et ce que l'on appelle densité, n'est que tf.
En voila une question qu'elle est bonne smile.gif


Quand tu dis : je me méfie : tu penses qu'un même mot n'est pas interprété de la même façon par differentes personnes ?

J'aurais tendance à dire que la densité se rapproche plus de la masse que du poids. (j'englobe l'environnement dans la densité )

Jeff,
thick
CITATION(Cariboo @ dimanche 28 janvier 2007, 13h06) *
Ceci dit, en toute rigueur, rien n'interdit d'appeler densité le ratio nombre d'occurrences / nombre total de mots. Quand je parle de fréquence, c'est bien la même définition.

Dans la notion habituelle de densité (ou de fréquence des termes), la longueur du document n'est pas prise en compte. Un mot présent une fois dans un texte de 100 mots, aura la même fréquence qu'un mot présent deux fois dans un texte de 200 mots.

Hein ??????????
Attendez, j'hallucine franchement de lire ça venant de toi.
Bien sûr qu'on peut avoir plusieurs intérprétations du terme densité puisqu'il faut prendre en compte l'environnement. Par contre, quand on parle de densité dans le domaine du référencement je ne vois qu'une définition et elle implique bien la prise en compte du corpus de la page et rien d'autre. Où y a t'il un outil ou un référenceur qui va parler de densité par rapport à quelque chose d'externe à la page ????
Si on admettait prendre d'autres éléments donc j'en cite quelques uns plus haut oui je veux bien qu'on puisse admettre densité autremement, mais on ne peut pas utiliser des termes autrement que dans le sens où tout le monde le comprend sinon comment se faire comprendre et parler de la même chose ?

En effet, peut-être que fréquence est mieux approprié que densité pour parler du sujet dont on débat ici.

Edit : cela dit non on ne peut pas utiliser fréquence (je viens de relire mes définitions car j'avais un doute sur "fréquence":p) La fréquence implique la notion de temps. Où est ce qu'on parle de temps en terme de référencement ??? Concernant densité, la notion est certainement plus floue, mais si on parle de densité en trafiquant la notion communément admise par tous (densité d'un mot clé dans une page pour le réf) je crois que l'incompréhension est totale, conséquemment le message est carrément flou, tordu et biaisé. Et encore, on n'est que sur le Hub, mais si c'était une publication sur Scientific America je crois que la communauté scientifique te sauterait à la gorge.


CITATION(Sebastien @ vendredi 26 janvier 2007, 09h42) *
Etre en dessous de la norme c'est ne pas être pertinent. Etre au milieu de la norme c'est être moyen. Etre dans le haut de la norme c'est être éventuellement jugé plus pertinent. Etre au dela de la norme c'est être suspect wink.gif

Je suis à 100% d'accord avec l'interprétation de Cariboo.

Hmmm quelle est la norme ? Tu penses vraiment que les requêtes sont toutes "égales" en terme de filtres algorithmiques ? A mon avis, c'est fausser le référenceur que de lui faire croire qu'on peut travailler sur les mêmes normes de densité, peu importe de la requête.
Jeff
En effet , je pense que le terme "densité" est utilisé et adapté d'une façon différente de sa définition littéraire dans le monde du référencement c'est un peu comme le terme :Référencement

Référencement => action à référencer un site dans une base de données de moteur.
Le reste c'est de l'optimisation... et bien plus encore.

Jeff,
thick
CITATION(Jeff @ dimanche 28 janvier 2007, 13h54) *
Référencement => action à référencer un site dans une base de données de moteur.
Le reste c'est de l'optimisation.

Ben oui ça c'est encore plus vrai que pour "densité" laugh.gif Mais bon attaquons une chose à la fois tongue.gif On a presque tordu le "PageRank", on remet en place "densité" et après on recale "référencement". Faut partir de la base et monter vers le sommet de la pyramide.
Cariboo
Laurent, tu as raison, mais dans un autre contexte.

Là je parle dans le contexte des statistiques, et, en statistique, on appelle fréquence le rapport entre l'effectif d'une valeur et l'effectif total. Plus de notion de temps.

C'est bien le problème, lorsqu'on utilise un mot "hors contexte", il est souvent mal compris.

A force d'en parler, j'ai fini par comprendre ce qui me gênait dans le terme densité. C'est la confusion avec la "densité de population" qui est une mesure qui a une dimension (elle se mesure en habitants au km2). Quand on leur parle de "keyword density", j'ai observé que certains voyaient une mesure du nombre de mots rapporté à la taille de la page. C'est ce télescopage que je trouve malheureux, car il conduit à des erreurs de raisonnement que l'on retrouve dans les forums de SEO.
thick
Aaah merci Cariboo pour ces explications limpides. Je vais pouvoir te décrypter un peu mieux sur ce sujet wink.gif
Sebastien
Le terme "langage naturel" est effectivement insatisfaisant, car en fait il y a plusieurs langages naturels selon le contexte.

Cela dit pour le web, suivre les directive d'accessibilité des WCAG et s'efforcer d'écrire en langue simple et claire (plain language), permet avec une emphase sur les mots-clés stratégique de produire des contenus naturellement optimisés pour les utilisateurs et les moteurs. Quand je dis "emphase" j'entend par là insérer les mots clés un tout petit peu plus que ce que l'on écrirait si les moteurs n'existaient pas, sans pour autant produire un texte pénible à lire wink.gif (bref c'est toujours une question de dosage et d'expérience)
Jeff
CITATION(Sebastien @ dimanche 28 janvier 2007, 16h18) *
Le terme "langage naturel" est effectivement insatisfaisant, car en fait il y a plusieurs langages naturels selon le contexte.

Cela dit pour le web, suivre les directive d'accessibilité des WCAG et s'efforcer d'écrire en langue simple et claire (plain language), permet avec une emphase sur les mots-clés stratégique de produire des contenus naturellement optimisés pour les utilisateurs et les moteurs. Quand je dis "emphase" j'entend par là insérer les mots clés un tout petit peu plus que ce que l'on écrirait si les moteurs n'existaient pas, sans pour autant produire un texte pénible à lire wink.gif (bref c'est toujours une question de dosage et d'expérience)


Sébastien, ton explication pourrait être mal interprétée et certains pourraient penser que tu incites à suroptimiser les pages sur une requête en augmentant le nombre de mots clés wink.gif

Si un mot doit exister alors qu'il existe, jouer sur les mots (leurs nombres) peut dans certains cas faire prendre des risques inutiles au site si cette méthode est appliquée à son ensemble.

J'ai bien noté que tu mets en garde en parlant de dosage et d'expérience, faudrait-il encore bien définir les mots dosage et expérience wink.gif

Mais je crains que l'on remette en cause tout le language utilisé dans le big word du SEO.

Jeff,
lafleur
CITATION(Sebastien @ dimanche 28 janvier 2007, 16h18) *
Cela dit pour le web, suivre les directive d'accessibilité des WCAG et s'efforcer d'écrire en langue simple et claire (plain language), permet avec une emphase sur les mots-clés stratégique de produire des contenus naturellement optimisés pour les utilisateurs et les moteurs.


Sébastien, je veux pas dire, mais relis-toi, : ta phrase est exactement le contraire de ce qu'elle serait si tu suivais le conseil que tu donnes, faut la lire trois fois pour la piger laugh.gif

(La mienne aussi, mais c'est pas moi qui file le conseil tongue.gif )

Mais c'est bien mieux ainsi a_thumbsup_20.gif "Simple et clair", ça veut dire sujet-verbe-complément avec un vocabulaire de 300 mots. Ce genre de conseil s'adresse au rédacteur débutant de chez débutant, on ne peut pas en rester là si on a un sujet sur lequel on a des objectifs précis et ambitieux.

De plus, en matière commerciale, il vaut mieux ne pas être trop clair sur certains aspects du produit que l'on doit mettre en avant ! shutup.gif

(Amis hubiens, j'ai déjà pondu des posts moins constructifs ici, mais pas souvent. Mes excuses, hein ! smile.gif )
Sebastien
CITATION
ta phrase est exactement le contraire de ce qu'elle serait si tu suivais le conseil que tu donnes


Tu as tout à fait raison, ce qui montre bien que l'écriture est un sujet complexe tongue.gif Donc ce que je disais, c'est que pour produire un texte bien conçu pour le référencement, on ferait bien de s'inspirer des techniques pronées par le W3C, ainsi que des techniques d'écriture en langage clair, en insistant juste un peu plus fort sur ses mots-clés (mais sans sacrifier la lisibilité).

J'espère avoir été plus clair, sinon j'ai cette synthèse sur le sujet smile.gif
lafleur
Oui oui Sébastien, tu es très clair, je note je note wink.gif

Mais je ne suis pas d'accord du tout (du tout du tout) avec le fond du propos, qui est grosso-modo celui du site http://www.redaction.be/ qui fait hélas référence en la matière. Ce débat dépassant le cadre du Hub, je vais, au grand dam de mon amour-propre, te laisser le dernier mot en ne donnant aucun argument smile.gif

Pour revenir au débat d'origine, nous pouvons quand même constater que des référenceurs se basent bel et bien sur l'idée de densité de mots-clés et obtiennent d'excellents résultats.

Parce qu'à un moment, le discours est : il y a un Graal (une densité optimale, ou fréquence idéale, ou ce que vous voulez), mais il est inatteignable à moins d'être pur (comme Galaad, forcément) c'est à dire ne pas se souiller à écrire pour le robot mais à écrire "naturellement".

D'où puissante réflexion : s'il y a densité idéale, pourquoi aurait-on plus de chance de l'atteindre en laissant faire le hasard (en écrivant "naturellement") qu'en tentant de forcer le destin et en essayant de repérer, fût-ce empiriquement, ce qu'elle pourrait être ?

Donc d'accord pour moi pour l'écriture sans s'occuper de densité ou autre, parce que c'est une façon de faire qui me va bien et qui fonctionne pas mal. Mais il faut tout de même reconnaître que d'excellents référenceurs, genre bien pros avec expérience sur des années et top positions sur du long terme, ont un autre discours, travaillent autrement et obtiennent d'excellents résultats !

On va pas se la jouer pensée unique sur un truc aussi flou que le réf, si ? smartass.gif
Jan
Je ne vais pas rentrer avec vous dans un débat sémantique sur la "densité" ou la "fréquence". Ca dépasse largement mes compétences laugh.gif

En revanche j'ai l'impression que parler de densité idéale dans l'absolu c'est faire fausse route. En matière d'optimisation, et particulièrement de frontière entre optimisation idéale et suroptimisation, il est vain de disserter en faisant abstraction d'un élément primordial: tous les sites ne sont pas égaux face aux filtres.

L'age du site, ses backlinks, son pagerank, son trustrank, etc... jouent un rôle clé. Pour parler trivialement, plus un site a de poil aux pattes, de backlinks, ou de "capital confiance" (notion bien floue j'en conviens), plus son webmaster peut se permettre de "bourriner" en matière d'optimisation.

A mon avis, la densité ou le nombre d'occurences de mots-clés présents dans une page n'échapppent à cette règle wink.gif
thick
Ouf enfin quelqu'un pour venir à mon secours. Merci Jan wink.gif
100% d'accord avec ce que tu dis et j'ajoute juste ce que j'ai dit quelque part plus haut. Les filtres sur les requêtes ne sont pas tous les mêmes. Ainsi, la "densité" peut être bonne sur une requête et pas l'autre. Puis aux quelques paramètres qu'on cite, il y en a quelques centaines d'autres qu'il faudrait inclure pour avoir une mesure juste de l'environnement et du corpus.
zapman
CITATION(Sebastien @ lundi 29 janvier 2007, 05h34) *
J'espère avoir été plus clair, sinon j'ai cette synthèse sur le sujet smile.gif

[Hors sujet]
Je fais une petite parenthèse parasite à ce sujet pour dire à Sébastien à quel point j'aime ce qu'il écrit. Cette synthèse sur le "text-appeal" est une merveille. Merci d'exister, Sébastien !
[/Hors sujet]
Le-juge
Je prends le sujet un peu tard dommage car ce debat sur la definition de la densite et de son utilite ou non etait passionnant.

Pour resumer le fond de ma pensee je dirais un peu comme seb:

Dans la mesure ou l'on respecte les Guidelines pour optimiser le site il y a de grandes chances que les internautes lisent les textes qui composent le site.

Or si ces textes doivent etre optimise au niveau de leur contenu pour les moteurs, il faut aussi que les internautes qui sont en general un poil plus critiques que les moterus de recherche vis a vis du style) le trouvent interessant. Si il y a donc Sur-densite cela va porter prejudice au site.

Perso je suis plus enclin a proner une certaine "correspondance" entre les mots cles presents sur le parcours du bot , ce qui a un impact sur la densite mais qui laisse beaucoup plus de libertes vis a vis des contenus.
dams41
Je pense que le calcul de la densité se fait par des statistiques des autres sites. Sur un mot clé précis, google doit faire un ratio du nombre de fois qu'apparait le mot clé par rapport à la quantité de contenu. Si un site dépasse trop fortement ce ratio, alors je pense qu'il est marqué comme trop dense, avec le risque de sandbox / blacklist ...
thick
Belle leçon de reverse engineering à la petite semaine que voilà !
Désolé, mais ton concept est trop simpliste pour me satisfaire...
zapman
CITATION(Le-juge @ jeudi 1 février 2007, 00h04) *
Perso je suis plus enclin a proner une certaine "correspondance" entre les mots cles presents sur le parcours du bot , ce qui a un impact sur la densite mais qui laisse beaucoup plus de libertes vis a vis des contenus.

Ho, ho... l'idée d'anticiper/gérer "le parcours du bot" éveille mon intérêt.
Pourrais-tu préciser ce que tu entends par là ?
Le-juge
CITATION
Pourrais-tu préciser ce que tu entends par là ?


C'est tres simple en fait - les bots peuvent tout a fait etre considere comme des internautes se servant de navigateur de 1ere generation (grosso modo) - ils parcourent le web en suivant les liens. Ils lisent le contenu des pages comme tout un chacun de gauche a droite et de haut en bas

LE PARCOURS :

1)Page de provenance du bot --> linking si possible avec des sites 1) en relation thematique, 2) possedant un fort PR, Trust Rank
2) Incoming Link --> toujours sur le site de provenance avoir un lien text qui contienne le mot cle correspondant a la page de destination (en l'occurence Mon site)
3) URL du site (attention je parles d'URL pas de domaine) --> Si possible avoir des mots cles dans l'URL (GG est de moins sn moins sensible a ca mais MSN oui
4) <title> - le mot cles sur lequel je veux optimiser ma page est presnet dans le <title>
5) <meta name="description"> --> Idem avec le mot cle dans un phrase coherente et attractive pour les client potentiels
6) <meta name="keywords"> tant qu'on optimise un page on fait tout keywords y compris
7) on retrouve le mots cles dans differents elements du contenu de la page - pas obligatoirement avec une densite enorme - et de maniere "harmonieuse" ca peut etre dans la nav, le texte, en titre , en sous titre ... --> attention le texte est ecrit pour les internautes

En plus en effet secondaire tu pourras voir que la densite de mots cle augmente d'elle meme, sans atteindre de pourcentage faramineux et tout en laissant un texte a la fois comprehensible pour les internautes et pertinent pour les moteurs.

Grosso modo voila - quand le bot note qu'il a vu le mot cles sur tout ce parcours on finit par avoir des resultats pas degueu smile.gif
Leonick
Je plussois.
En dehors de la balise keywords qui n'est plus utilisée que par yahoo.
Mais sinon, c'est ça : on écrit pour les visiteurs en pensant aux moteurs et pas le contraire.
Parce que, quand dans les résultats de google, on voit une description et un titre bourrés de mots clés, même si le lien est 1°, on n'ira pas.
De la même manière que dans un magasin, en règle générale, on a horreur qu'un vendeur essaie de nous forcer la main.
zapman
CITATION(Le-juge @ jeudi 1 février 2007, 22h12) *
1)Page de provenance du bot --> linking si possible avec des sites 1) en relation thematique, 2) possedant un fort PR, Trust Rank
2) Incoming Link --> toujours sur le site de provenance avoir un lien text qui contienne le mot cle correspondant a la page de destination (en l'occurence Mon site)
3) URL du site (attention je parles d'URL pas de domaine) --> Si possible avoir des mots cles dans l'URL (GG est de moins sn moins sensible a ca mais MSN oui
4) <title> - le mot cles sur lequel je veux optimiser ma page est presnet dans le <title>
5) <meta name="description"> --> Idem avec le mot cle dans un phrase coherente et attractive pour les client potentiels
6) <meta name="keywords"> tant qu'on optimise un page on fait tout keywords y compris
7) on retrouve le mots cles dans differents elements du contenu de la page - pas obligatoirement avec une densite enorme - et de maniere "harmonieuse" ca peut etre dans la nav, le texte, en titre , en sous titre ... --> attention le texte est ecrit pour les internautes

D'accord, rien de vraiment nouveau dans tout ça. C'est juste que je n'avais envisagé la problématique sous l'angle du parcours que suivent les robots. C'est intéressant de garder cette idée en tête.

J'ajoute à ta liste l'idée de construire une page "tête de chapitre" qui commence déjà à placer quelques mots clés dans un résumé des contenus proposés au visiteur, et qui renvoie sur toutes les pages dont la thématique encadre le ou les mots clés qu'on souhaite promouvoir.

Si ce résumé est un texte original (non repris dans les pages présentées) et que cette page comporte quelques liens externes pointant vers des pages fortement connexes avec la thématique du chapitre on obtient un très bon positionnement de cette tête de chapitre qu'on pourrait également baptiser "page portail".

Toutes les pages "phares" de mon site correspondent à cette description. wink.gif
Le-juge
CITATION
D'accord, rien de vraiment nouveau dans tout ça.

tongue.gif

Ah ben non ya pas grand chose de nouveau. Je vais pas re-inventer la roue non plus
dams41
CITATION(thick @ mercredi 31 janvier 2007, 18h42) *
Belle leçon de reverse engineering à la petite semaine que voilà !


J'émet simplement une idée, un principe de fonctionnement, pas une vérité, et encore moins du "reverse engineering". Ce que je sais c'est qu'un robot ne peux as comprendre les phrases telles qu'elles sont. Il peut simplement compter des mots clés, leur accorder une importance selon différents critères, ce qui forme l'algorithme de google. Comment savoir si on effectue beacoup de répétition dans un texte ? un nombre absolue ? Bien sûr que non, sinon nous ne pourrions utiliser la plupart des déterminants / articles etc... La répétition abusive de mots dépend donc du type de mot ciblé. Ainsi google ne considère pas les déterminants / articles etc... comme des mots clés.
Pour le reste ? pour qu'un robot puisse savoir si un mot est trop utilisé, il doit se baser sur un échantillon non ? Ou tu considères qu'un programme du type
CODE
int nb_max = random(1000);
if(nombre_mot_clé > nb_max){
  sandbox();
}

peut s'avérer suffisant ?

Pour se baser sur un échantillion, il existe plusieurs méthodes d'apprentissages, les réseaux bayésien et les réseaux de neuronnes principalement. Mais ils se servent d'un échantillion d'observation pour déterminer la classe (un texte dans notre cas). Ainsi, une bonne méthode serait de classer un texte donné dans une classe en fonction du nombre d'occurence de mots clés trouvés par rapport à tous les autres textes disponibles (la base du réseau bayésien, utilisé notamment par thunderbird pour traiter les spams). Une fois qu'on connait la classe d'un texte (son thème), on peut observer le ratio "nombre d'occurence d'un mot clé / taille du texte" par rapport au même ratio pour les textes de la même classe, et ainsi déterminer (avec une marge d'erreur) si un texte est trop répétitif ou non.

Voilà le principe de fonctionnement que je voulais évoquer, mais une fois de plus, je ne sais pas si ça fonctionne ainsi. J'expose simplement une méthode qui ne me semble pas tirée par les cheveux. Et quand bien même mes propos seraient totalement "idiots" (ce qui est peut-être le cas), nous pouvons en discuter, en débattre. N'est-ce pas là le but d'un forum ?

Quoi qu'il en soit, rien ne t'autorises à te montrer injurieux vis a vis de mes pensées, d'autant que ma reflexion se base tout de même sur les cours de spécialistes de fouilles de texte que j'ai eu la chance de suivre récemment... Preuve que ça ne doit pas être si crétin que ça...

CITATION(thick @ mercredi 31 janvier 2007, 18h42) *
Désolé, mais ton concept est trop simpliste pour me satisfaire...

Tout d'abord, je dirai que je ne suis pas là pour te satisfaire. Ensuite, expliques pourquoi tu trouves le concept trop simpliste ! Car en ces termes, ta contribution ne sert à rien...
thick
CITATION(dams41 @ samedi 3 février 2007, 14h11) *
Tout d'abord, je dirai que je ne suis pas là pour te satisfaire. Ensuite, expliques pourquoi tu trouves le concept trop simpliste ! Car en ces termes, ta contribution ne sert à rien...

Relis les posts depuis le début du thread et tu comprendras mieux. Tu définis en 2 lignes le concept et ma réponse devrait faire 3 kms ??? Allons, ton truc est simpliste au possible et oui ça ne me convient pas du tout parce que tu n'apportes rien au débat. Depuis le début je m'échine à dire que la longueur du texte ne compte pas et tu viens en remettre une couche ? Ben désolé, mais non c'est complétement futile de venir ajouter ton "petit" commentaire tel qu'il est. A ta place, il valait mieux s'abstenir.
dams41
CITATION(thick @ samedi 3 février 2007, 15h30) *
Relis les posts depuis le début du thread et tu comprendras mieux.


Je viens de tout bien relire, c'est fait. J'ai réexpliqué mon point de vue dans le post précédent, en me basant sur une théorie un peu différente de celle de cariboo (encore que pas si eloignée que ça) des réseaux d'apprentissage. Mon truc est donc simpliste au possible reseaux neuroniques et bayésiens, sauf que ce n'est pas "mon" truc, mais un sujet de recherche fondamentale qui permettra peut-être à long terme de faire comprendre un texte à un robot.

CITATION(thick @ samedi 3 février 2007, 15h30) *
Depuis le début je m'échine à dire que la longueur du texte ne compte pas


Je suis désolé d'avoir osé penser différement de toi sad.gif. Si j'avais sû que ce forum ne permettait pas de s'exprimer, je me serais contenté de m'abreuver de tes profondes paroles... (ie : je suis d'accord, je ne suis pas d'accord, j'aime pas le mot "densité")
CITATION(thick @ samedi 3 février 2007, 15h30) *
tu n'apportes rien au débat

Je tiens à m'en excuser auprès des membres du forum.

CITATION(thick @ samedi 3 février 2007, 15h30) *
A ta place, il valait mieux s'abstenir

C'est ce que je compte faire...
Ceci est une version "bas débit" de notre forum. Pour voir la version complète avec plus d'information, la mise en page et les images, veuillez cliquer ici.