Citation
Sauf que formulé comme cela et sorti du contexte, cela devient faux. Il ne s'agit pas d'une "densité", le terme est impropre et trop connoté, mais d'une fréquence. Et ce n'est pas "une" fréquence qui constitue le critère, mais l'ensemble des fréquences de tous les termes. Sans compter qu'il existe un ordre caché dans ces stats (de niveau 2) qui révèle les relations entre ces termes. Relation que l'on peut aussi prendre en compte au plus bas niveau en tenant compte de la distance entre les termes...
Bref, isoler dans le raisonnement la fréquence d'un seul terme conduit souvent à de fausses conclusions.
Citation
Attention, tu as parfaitement raison, mais je ne crois pas que les suroptimisations soient détectées et prises en compte dans l'algo de base. Il me semble par contre facile de faire un filtre antispam sur ce genre de critères pour détecter des pages anormales et de les déclasser automatiquement (toujours le distinguo chez Google entre "filtre" et "algorithme de classement").
Citation
Etudier les 30 premiers résultats (plutôt les 100 d'ailleurs) en aspirant les snippets pour les triturer à grand coup d'outils de statistiques linguistiques permet effectivement d'en tirer des conclusions valables pour savoir comment doper une page de termes idoines avec le bon dosage pour arriver en tête des résultats.
Mais l'étude des densités seules ne donnera rien. Il faut étudier les taux de cooccurrence, et savoir utiliser la méthode.
Les expériences que j'ai menées m'ont montré que le jeu n'en valait pas la chandelle. Déjà il faut passer du temps pour acquérir l'expérience nécessaire pour utiliser les résultats intelligemment. Ensuite le fait de ne pas connaître suffisamment d'infos sur le corpus (l'index du moteur) fait que tout cela est approximatif. Et de toute façon, écrire en langage naturel est moins compliqué ...
Citation
Tu as raison, c'est bien le problème. Les critères "in page" changent radicalement le classement obtenu à partir du seul poids des termes, c'est ce qui rend vain un travail systématique sur la densité de mots clés.




Haut

















