Aller au contenu

calcul de densite d une expression


Sujets conseillés

Bonjour a tous,

Je me pose une question a savoir , quelle est la bonne methode pour un calcul de densite d un mot?

Une expression de 3 mots par exemple:

mot1 mot2 mot3

Pour obtenir un resultat correct est il preferable de:

1- separer les mots de l expression puis calculer le nombre de fois ou je trouve chacun des mots puis j additionne et je fais un calcul de pourcentage par rapport au nombre total du texte

2- je considere que l expression de 3 mots est un seul mot, je calcule combien de fois je trouve cette expression dans le texte , j additonne le tout et je muliplie par le nombre de mot de l expression puis je fais mon pourcentage par rapport aux nombre de mot total

Moi j opterai plutot pour la deux ....

peut etre avez vous une autre vision des choses?

Lien vers le commentaire
Partager sur d’autres sites

Oula !

Ta question ne prendra du sens que si on sait quel est l'objectif que tu poursuis en voulant réaliser une mesure de densité :

- densité dans une page, ou un extrait ?

- fréquence d'apparition dans un corpus ?

- fréquence d'apparition d'un syntagme dans une langue ?

Si tu veux mesurer la densité d'un syntagme dans un texte, tu dois découper le texte en syntagmes (ce qui est loin d'être trivial) et calculer le ratio entre nombre de fois ou le syntagme clé est présent et le nombre de syntagmes différent dans ton texte.

Tu peux également travailler sur des n-grammes : c'est pas évident non plus, mais cela demande des connaissances algorithmiques, pas linguistiques. Dans ce cas, tu découpes ton texte en trigrammes consécutifs, et tu mesures le ratio présence du trigramme clé sur nombre total de trigrammes...

Pour plusieurs mots, classiquement, on ne mesure pas une densité, mais un indice de co-occurence, ce qui a beaucoup plus de sens en général. Mais comme je ne sais ce que veux calculer exactement, je ne peux pas t'affirmer que c'est ce qu'il faut faire dans ton cas.

Lien vers le commentaire
Partager sur d’autres sites

Non pas forcément.

Tel que tu le confirmes, tu veux bien calculer une densité d'un syntagme dans un texte.

Dans ce cas, il faut utiliser la formule :

Densité = nombre d'occurences du syntagme / nombre de syntagmes dans la page

Euh, si je peux te permettre de te le demander, à quoi va te servir une telle mesure... Parce qu'elle est connue pour ne pas avoir un intérêt très grand dans la plupart des utilisations, y compris en linguistique statistique. Et surtout pas en référencement.

Lien vers le commentaire
Partager sur d’autres sites

Posté (modifié)

Rebonjour, merci pour ta reponse donc je suis en train de creer un petit outil qui permet de calculer la densite d une expression dans une page, je deshabille la page, balise, texte etc et je veux maintenant faire un calcul de densite

par exemple pour la balise title

<title> mot1 mot2 mot3</title> quel est la densite de l expression dans le corps de la balise title

ah oui j oublais , tu penses sincerement que la densite d un mot ou d une expression dans une page n a aucun lien avec le referencement ? ou peut etre ai je mal interprete :blush: ce que tu as dit, tu me parlais peut etre de l utilisation de "densité d'un syntagme"

Je te remercie

Modifié par other_fr
Lien vers le commentaire
Partager sur d’autres sites

Oui, beaucoup croient que renforcer la densité d'un mot clé sur une page va améliorer leur référencement sur une requête contenant ce mot clé. Passer d'une densité faible à une densité "normale" a une influence généralement positive. Mais au delà, on est parfois déçu.

C'est normal car les outils de recherche n'utilisent absolument pas la densité comme un critère pour classer les pages... En tout cas plus du tout depuis 1993/94...

Classiquement, ils utilisent une mesure de similarité textuelle, comme tf*idf, dont la formule ressemble à une densité, mais ce n'est pas du tout le même genre de densité.

C'est vrai notamment si la requête contient plusieurs mots, car dans ce cas, les résultats deviennent très déconnectés de la mesure des densités de chacun des mots dans la page.

Bref, ce qu'il faut améliorer, c'est la similarité entre la requête et sa page... Mais comme chaque moteur a sa recette de cuisine, ce n'est pas facile.

Lien vers le commentaire
Partager sur d’autres sites

Re,

Que me conseilles tu concretement?

D abandonner cet outil ?

De me limiter a decortiquer la page sans prendre en compte la densite ? ou autre choses ^_^

Malgre tout ca, je pense que la densite a qd meme un role a jouer dans le referencement aussi minime soit il certainement moins que de par le passe.

Lien vers le commentaire
Partager sur d’autres sites

ce que je conseille à tout le monde, c'est d'abandonner l'utilisation de la densité de mots clés... Cela conduit la plupart des référenceurs du dimanche à faire des bêtises, car une suroptimisation conduit souvent dans les profondeurs du classement.

L'idéal est :

1°) de se consituer une calculette magique permettant de calculer plusieurs mesures de linguistique statistique : indice de co-occurence, tf*idf, dice, jacquard etc...

2°) d'analyser les résultats des pages concurrentes sur ces différentes mesures.

On en devine souvent (mais pas toujours, car il y'a aussi de nombreux critères offpage et des critères inpage qui ne sont pas liés au contenu texte) des enseignements, moteur par moteur, sur ce qui fait que certaines pages sont mieux classées que d'autres.

Il suffit ensuite d'optimiser le contenu pour qu'il optienne des notes similaires ou meilleures.

Lien vers le commentaire
Partager sur d’autres sites

ce que je conseille à tout le monde, c'est d'abandonner l'utilisation de la densité de mots clés... Cela conduit la plupart des référenceurs du dimanche à faire des bêtises, car une suroptimisation conduit souvent dans les profondeurs du classement.

L'idéal est :

1°) de se consituer une calculette magique permettant de calculer plusieurs mesures de linguistique statistique : indice de co-occurence, tf*idf, dice, jacquard etc...

2°) d'analyser les résultats des pages concurrentes sur ces différentes mesures.

On en devine souvent (mais pas toujours, car il y'a aussi de nombreux critères offpage et des critères inpage qui ne sont pas liés au contenu texte)  des enseignements, moteur par moteur, sur ce qui fait que certaines pages sont mieux classées que d'autres.

Il suffit ensuite d'optimiser le contenu pour qu'il optienne des notes similaires ou meilleures.

<{POST_SNAPBACK}>

Et cette calculette magique on peux la trouver où ? :) Donne nous ton secret grand magicien ! :hypocrite:

Benoit

Lien vers le commentaire
Partager sur d’autres sites

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...