J'entame la publication aujourd'hui d'une série de 6 articles (plus une annexe bibliographique) sur l'état de l'art en sémantique et linguistique appliquée dans les moteurs de recherche et le référencement...
Je publie aujourd'hui le premier article :
INTRODUCTION A LA SEMANTIQUE ET A LA LINGUISTIQUE STATISTIQUE
Ainsi que la partie "Annexes" avec les références bibliographiques ...
LES ANNEXES
Et je communique, pour ceux qui veulent suivre le feuilleton, les prochains articles, qui seront publiés d'ici la fin du mois.
DEUXIEME PARTIE : LA SEMANTIQUE ET LES OUTILS DE RECHERCHE
1. Quel rôle joue aujourd'hui la sémantique et la linguistique dans les moteurs de recherche grand public ?
2. Les moteurs de recherche actuels utilisant la sémantique
3. La sémantique : comment révolutionner demain la recherche d'information sur le web
TROISIEME PARTIE : L'AUTRE SEMANTIQUE - LE WEB SEMANTIQUE ET LA RECHERCHE D'INFORMATION
1. Le Web Sémantique : principes et applications
On parle beaucoup de sémantique entre webmasters, mais le terme recouvre plusieurs notions très éloignées.
2. Le Web Sémantique : une utopie condamnée ou une révolution en marche ?
Le Web Sémantique à ses militants inconditionnels, mais aussi ses pourfendeurs et ses détracteurs. Quels sont les arguments des uns et des autres ?
3. L'exemple de SEMTAG : le balisage sémantique automatique est possible
Créer un outil permettant d'ajouter automatiquement les bonnes balises dans des documents non balisés permet d'envisager de nouvelles applications pour le web sémantique
QUATRIEME PARTIE : METHODES LINGUISTIQUES ET SEMANTIQUES DANS LES SYSTEMES D'EXTRACTION D'INFORMATION
- Méthodes Statistiques
- Analyse Morphologique
- Analyse Syntaxique
- Evaluation de pertinence : modèle vectoriel contre modèle booléen
- L'expansion de requête
- Le retour de pertinence
- Les thesaurus
- L'approche inférentielle de la recherche : algorithmes bayesiens
- Le problème de la désambiguation
- Les ontologies et les taxonomies
- Les relations sémantiques
- Théorie probabiliste de l'information de Shannon
- Désambiguation probabiliste
- Le clustering
CINQUIEME PARTIE : APERCU DES ALGORITHMES ET OUTILS MATHEMATIQUES
1. Densité de mots clés, et modèles vectoriels de Salton
2. Les mesures de similarités
indice de co-occurence
ratio EF
cosinus de Salton
coefficient de Dice
les mesures de similarité conceptuelles : Resnik, Jiang-Conrath, Hirst-St Onge, Wu-Palmer...
CINQUIEME PARTIE : APPLICATIONS PRATIQUES POUR LE REFERENCEMENT
Savoir sur quelles requêtes se positionner
Optimiser son contenu pour le référencement
Générer du contenu automatiquement
SIXIEME PARTIE : APPLICATIONS PRATIQUES POUR LE KM ET LES OR
Elaboration d'un filtre suivant le profil de recherche de l'utilisateur
Lemmatisation et utilisation de thésaurus et de bases lexicales
Méthodologie de création d'une ontologie
Les méthodes d'expansion de requête
Trouver les documents pertinents
Catégoriser des pages en fonction de leur contenu
Applications sophistiquées d'extraction de données sur le web
Créer un système de FAQ automatique à la Ask Jeeves
ANNEXES
LIENS UTILES
BIBLIOGRAPHIE
