Aller au contenu

L'indexation


Gibou

Sujets conseillés

Bien le bonjour !

Une fois de plus, lorsque je plante sévère, je viens chercher de l'aide auprès des pros :whistling:

Je voudrais faire un moteur de recherche interne à mon site.

Jusque là, je faisais rentrer un/des mots clés dans un champs et le script php allait fouiller les dossiers, faisait des fopen sur toutes les pages.html et php qu'il trouvait, extrayait le code php et html et faisait une recherche des mots clés dans ce qu'il restait ... et ça marche très bien ... sauf que ça rame et que ça va couter des ressources à l'hébergeur si trop de personnes font cette requête en même temps.

Il paraît qu'il faut indexer les pages mais en quoi cela consiste-t-il exactement ? Mettre dans une table sql le nom de la page et en face les mots les plus récurrents ?

Si c'est ça, je ne vois pas quel script php pourrait extraire les mots les plus récurrents d'une page et les stocker dans la bdd. Enfin, si, mais c'est super lourd !!

Un peu d'aide siouplait ?? Merci infiniement :hourra:

Lien vers le commentaire
Partager sur d’autres sites

Jettes un oeil au programme opensource phpdig. Il fait ce que tu cherches, et il le fait très bien, très rapidement, et.. bref, jettes y un oeil.

A l'occasion, regarde comment il fait, c'est (aussi) intéressant de connaitre la méthode d'indexation des doc/pages/sites d'un moteur.

Lien vers le commentaire
Partager sur d’autres sites

Il paraît qu'il faut indexer les pages mais en quoi cela consiste-t-il exactement ? Mettre dans une table sql le nom de la page et en face les mots les plus récurrents ?

<{POST_SNAPBACK}>

En fait, c'est plutôt l'inverse : mettre les mots récurrent dans une table, et en face les URL correspondantes, car il y a généralement moins de mots que d'URL (enfin... c'est très résumé:))

Lien vers le commentaire
Partager sur d’autres sites

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...