Jump to content
Sign in to follow this  
Guest Shinji-49

KlozaSeek

Rate this topic

Recommended Posts

Guest Shinji-49

Bonjour,

Ayant cherché pendant des mois maintenant un moteur de recherche de sites externes qui me convienne, je me suis dit on n'est jamais mieux servi que par soi-même et comme jai quelques connaissances en php je me suis dit que je vais essayer de le faire !

Je lai fait et en une semaine mais ce nest que la version BETA 0.1 qui va être améliorée. Je remercie des gens dun site de php (Ya le droit de faire de la publicité ?) qui mon aidé deux fois sur deux trucs qui était en fait très très simples.

Vous pouvez le tester sur mon site à cette adresse : http://www.kloza.com/seek car il était tout dabord destiné à celui-ci et y référencer votre site.

Vous pouvez le télécharger à cette adresse : http://www.kloza.com/seek/klozaseek.zip .

Voila, je vous le redis, c'est la version béta et donc il va être travaillé et celui ci à été conçu pour que vous ne perdiez pas les données au changement de version alors tentez le coup ! ++++

Share this post


Link to post
Share on other sites

Bonjour,

Voici quelques coquilles à corriger dans les mails de test que j'ai reçu :

"Votre Url - sous le nom de - à bien été ajoutée le 03/04/04." --> "a bien été" (pas d'accent sur le "a").

"Votre Url - sous le nom de - a été modifier le 03/04/04 par l'administrateur de KlozaSeek." --> "a été modifiée"

A plus,

Fruge.

Share this post


Link to post
Share on other sites
Guest Ldo

quel sont ses fonctionalitées ?

d'aprés le formulaire d'ajout, il y est demandé une description, des mots clés..., le moteur ne va pas extraire le cotenu de la page ?

Share this post


Link to post
Share on other sites

Ldo, ce n'est pas un moteur de recherche autonome comme Google. Ce n'est pas non plus un annuaire puisque les informations entrées par celui qui soumet un site ne sont pas vérifiées par un être de chair et de sang.

Kloza est plus une base de données de sites. Tu rentre les informations que tu veux sur ton site, et la recherche sera basée sur les informations que tu as entré (et non sur ce qu'un robot va aller lire). L'avantage est qu'ici, ton site est aussitôt référencé. L'inconvénient, c'est qu'on peut entrer tout et n'importe quoi...

Pour moi, c'est un trés bel outil si on vérifie les informations qu'entre les utilisateurs...

Tizel

Share this post


Link to post
Share on other sites
Guest Ldo

c'est justement ce qu'il me semblait, mais la presentation de Shinji n'offre que peu de detail sur l'outil en lui meme

pourtant un récuperage et une analyse du contenu de la page ne serait vraiment pas dur a faire

Edited by Ldo

Share this post


Link to post
Share on other sites

Ldo, de la page, peut être pas (mais ça demande quand même un temps non négligeable) mais un moteur de recherche visite tout le site, et là, ça pose beaucoup plus de problémes (notamment en ce qui concerne l'explosion de la taille de la base de données, du temps de traitement, du temps de rafraichissement...).

Pour se donner une idée, il suffit de voir l'évolution de Deep-Index, moteur de recherche créé par un particulier...

Sur le papier, créer un moteur de recherche est trés simple : j'aspire les pages, j'analyse le contenu, je stocke les mots dans une base de données et je crache le résultat quand on me le demande. Dans la pratique, c'est beaucoup plus compliqué, et c'est sans doute pour ça qu'il y a, au final, trés peu de moteurs de recherche.

Tizel

Share this post


Link to post
Share on other sites
Guest Shinji-49

Bonjour,

Je mescuse d'ariver tard mais j'ai pas été alerter comme quoi vous potiez ! lol

Bon la cette une version BETA et il y a quellque bug que vous n'avez pas du apercevoir. Merci pour les fautes d'orthographes car j'en fait beaucoup et donc je vais coriger sa pour la prochaine version qui risque de sortir cette fin de semaine mais sa c'est pas sur. Oui, le moteur n'extrait pas les données des Meta-Tags du moins pas encore car je suis débutant dans le php et je ne sais pas encore faire sa mais autrement ce que tu dit Ldo enfin les liens que tu me donne c'est pour me permettre de faire sa ? Car j'aimerai bien moi ! lol Autrement Tizel, les sites sont vérifiés par moi même bon la j'ai pas eu le temp car je suis pris sur un autre site mais autrement je les vérifits et tu a toute a fait raison sur ton dernier message.

Share this post


Link to post
Share on other sites
Guest Shinji-49

Oups, j'ai oublier de vous dire que de toutes façon à chaque ajout de sites je suis alerter ! De plus, vous pouvez apercevoir un lien admin dans le design en bas du script et bien il envoie sur l'espace admin lol et la je peut tout faire comme ajouter un site, en supprimer en modifier... allez++++

Share this post


Link to post
Share on other sites

Bonjour,

La fonction get_meta_tags permet d'extraire les tags meta d'un fichier passé en paramètre. Si cela peut t'aider à retrouver les métatags ;)

Anonymus.

Share this post


Link to post
Share on other sites
Guest Ldo

tyzel, je sait bien tout cela

mais bon, on pourrait trés bien imaginer, sans mettre en place du crawler, que le script choppe le contenu de chaque page, analyse la page, et ne conserve en base que les 10 mots les plus présent dans la page ainsi que ses pourcentages d'idm

dans la cadre d'un petit moteur spécialisé a un domaine, ajouter 20 pages a la main une par une, c'est pas la mort

au niveau des temps de calcul ca ne serait pas forcement si long ke ca.

pour mon outils sa lenteur viens du fait que j'ai codé ca il y a fort longtemps, a une epoque ou je maitrisait a peine php, aujourd'hui je pourrais facillement reduire le code de 3/4, mais par manke de temps ca reste ainsi

Share this post


Link to post
Share on other sites

Pas si long ?

phpdig est un moteur de recherche développé depuis pas mal de temps, qui arrive à un bon niveau d'optimisation, et qui met tout de même plusieurs heures avant de crawler un site complet. (un site complet n'est pas un site d'une vingtaine de pages, mais... plusieurs milliers (près de 6000 pour le Hub à l'heure actuelle)).

Là, l'index commence à grossir de manière impressionnante, et ralentit l'execution du script de façon spectaculaire.

Pour un site, ce n'est effectivement pas compliqué, et tu peux te permettre d'attendre. Le laisser à dispo de tout le monde, c'est le risque de voir les gens te faire crawler les sites de microsoft, wanadoo, aol et amazon en même temps, soit près de 3 800 000 pages.

Personnellement, j'ai essayé de crawler des sites avec phpdig : Ca ramer dur au dessus de 10 sites, lorsque l'index dépasse 1 million d'enregistrements. (je ne parle pas du nombre de pages, juste de l'index.)

Voilà mon expérience.

A+, Anonymus.

Share this post


Link to post
Share on other sites
Guest Shinji-49

En clair je fait quoi ? J'ajoute la fonction qui lit les meta-tags et les enregistre dans la base de données ou alors je laisse comme sa ?

Share this post


Link to post
Share on other sites
Guest Shinji-49

Heu Anonymus je viens de voir ton site ! Dit estce que ce serait possible de diffuser mon script ou a moins qu'il ne soit pas encore à la hauteur ?

Share this post


Link to post
Share on other sites

Oui, bien sûr, à condition que le fichier que tu proposes en téléchargement ne soit pas endommagé, parce que je n'arrives pas à l'ouvrir, pour l'instant.

Et je ne le trouve pas sur ton site.. :(

Anonymus.

Share this post


Link to post
Share on other sites
Guest Shinji-49

Ha je viens de tester et oui il y a une erreur quand on l'ouvre ! lol je vous avait pas trop compris bon je vois sa tout de suite !

Share this post


Link to post
Share on other sites
Guest Shinji-49

voila sa fonctionne maintenant !

Share this post


Link to post
Share on other sites
Guest Ldo

heu anonymous, as tu deja vu ton site sous safari ?

je t'invite à le faire en utilisant : http://www.danvine.com/icapture/ (a defaut d'un mac sour la main)

pas mal de bug avec les positionnement des blocs et puis dans la navigation surtout

Share this post


Link to post
Share on other sites

Merci ;)

En fait, mon site me sert essentiellement de plateforme de test, pour les applications OS que je trouve ici ou là, et dont j'ai besoin.

C'est pourquoi les liens ne marchent pas, le design n'est pas au point, etc..

Par contre, tu pourras y trouver : oscommerce, phpdig, invision, phpmychat, et d'autres encore.

Bon.. Pour ce qui est des liens, c'est pareil, je les connais, alors bon... :(

Pour ce qui est du safari, je m'aperçois que je passe pas trop mal un peu partout, sauf peut etre sur IE4. Mais... je suis loin de l'apologie sur l'accessibilité. IE4 est un peu vieux ;)

A+, Anonymus

Share this post


Link to post
Share on other sites

Bonjour,

Pour KlozaSeek :

Tu aurais du mettre le 'top' et le 'bottom' des pages du site dans un include.

Là, si on veut changer le title de la page, on doit ouvrir presque tous les fichiers. On devrait pouvoir le faire en une seule fois. De plus, il faut penser que, pour que cela intéresse le plus de monde possible, il doit etre possible d'intégrer le site dans une page préexistante, autrement dit, avoir la possibilité d'enlever toutes les entetes (jusqu'à la balise <body>).

L'image est appelée 1.PNG, puis 1.png C'est source d'erreur :(

Tu fais partir les session_start après avoir envoyé du code html, dans admin/index. Ca affiche une erreur : cant send session cookie. Envoies d'abord les sessions, ensuite le texte html.

Lors de tes appels à mysql_connect, ou autres fonctions mysql, mets un arobase (@), ainsi :

$sql = _AT_mysql_connect(....

Ainsi, lorsque la fonction génère une erreur, celle ci ne s'affiche pas à l'écran. Tu peux alors mettre ton texte d'erreur personnalisé, qui sera seul à s'afficher.

A+, Anonymus.

Share this post


Link to post
Share on other sites
Guest Shinji-49

Re-bonjour,

C'est quoi le Top et Bottom ? lol

Pour le titre je vais m'en oqp pour la version BETA0.3 et les entetes je vais essayer, l'apelle des images aussi et pour les connexions mysql aussi. Pour l'erreur avec les sessions on me la dit aujourd'uit sur un t'chat et je vais m'en oqp. Merci d'avoir trouver toutes ces erreurs. Autrement vous devez tous vous dire pourkoi je fais que de l'appeler Beta et bien avant de passer a une version normal et bien je préfere que tout les bugs soit chassé ! Si il y en a d'autres merci de me les donners car sa m'intéresse ! +++ La version BETA 0.3 devrait sortir demain ou peut etre se soir ! lol

Share this post


Link to post
Share on other sites

include('top.php');

<body>

</body>

include('bottom.php');

top.php :

<html><head><meta.....></head>

idem pour bottom.

Anonymus.

Share this post


Link to post
Share on other sites
Guest Shinji-49

ha oki !

Et met attend ! Je dois mettre toutes mes pages en php et changer touts mes liens ! lol

Bon pour les pages sont toutes en php ! Les liens on été modier il ne manque plus que le reste...

La version BETA 0.3 est dispo à cette adresse : http://www.kloza.com/seek/klozaseek_VER0.3.zip les petits changement sont sité par Anonymus ! La demo est encore à la version BETA 0.2 mais vas passer à cette version ce soir !

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
Sign in to follow this  

×
×
  • Create New...