Aller au contenu

Siddartha

Hubmaster
  • Compteur de contenus

    748
  • Inscrit(e) le

  • Dernière visite

Tout ce qui a été posté par Siddartha

  1. Ce n'est pas nouveau en effet, ca leur prend quand ils ont envie de faire un peu de tracking ponctuel sur certaines requêtes. Généralement, c'est les prémices d'un chamboulement à venir sur ces requêtes ;-)
  2. C'est cela que j'ai encore du mal à saisir, comment peut on faire de la sémantique sans apprendre à l'application (type Circa) un minimum de linguistique ? Dans ce que tu m'expliques et ce que je comprends, cela voudrait dire que la sémantique appliquée dans Circa n'a pas réellement besoin de comprendre, seul le contexte et les connectivités entre expressions et mots suffisent pour établir un sens. Ce sens sera alors utilisé pour afficher ou être liés à d'autres notions du même sens. Mais cela au final, sans réelle compréhension de la 'signification' du sens et donc sans linguistique, l'outil ne comprend pas, il ne peut que que trier les sens et à nous de les comprendre lorsqu'il nous les propose. C'est pas simple à expliquer, j'espère que tu m'auras compris
  3. Je trouve cela au contraire trés captivant et surtout approprié dans le sens ou les moteurs de recherche de demain fonctionneront sous ces types de principes et seront capables de comprendre le sens d'une phrase ou d'un mot remis dans son contexte. Les applications découlant de ce type de techno sont complètement déroutantes, c'est la porte ouverte à de nombreux nouveaux services que ce soit sur le Web ou IRL, et j'avoue avoir du mal à comprendre pourquoi aujourd'hui ces technos ne sont pas encore plus developpézs que ca. Il y a peut être une réelle difficulté technologique à bosser dans ce domaine, mais je penche plutôt pour une pénurie de linguistes et de statisticiens destinés à élaborer ce type de techno. A propos, je ne vois pas mention dans cet article de notions statistiques ? J'avais rencontré il y a quelques mois déjà un chercheur du CNRS avec qui nous avions discuté de sémantique et de statistiques appliqués au web. A l'époque, il m'avait présenté un module de recherche capable de comprendre le sens des mots et de trier des résultats en fonction de leur environnement sémantique. L'application était trés impressionnante. Quid pour Circa ? N'utilise t-il pas d'énormes bases linguistiques pour appliquer des statistiques par rapport à une langue donnée, la proéminence d'un mot dans une langue, sa fréquence d'utilisation dans tel type de contexte, ses sens communs, etc ?? Les onze type de relations différentes ne sont elle pas basés sur des thésaurus, des stats ou autre types d'index ? Encore merci pour cet article Cariboo !
  4. Et si je change les paths des applis qui ont besoin d'utiliser PEAR sans pour autant changer le chemin des autres libs php par défaut ?
  5. Bonjour, Est il possible d'utiliser les paquets PEAR (pear.php.net) sur un compte mutualisé d'OVH ? Si je télécharge les paquets et que je les installe dans un dossier spécifique, ca devrait marcher non ?? Merci pour vos réponses!
  6. Non la toolbar Google de Firefox n'émane pas de Google, c'est une extension développée par des tiers Be zen :
  7. Une vulnérabilité de type validation d'entrée a été découverte dans la Google Toolbar. Du coup, un utilisateur local pourrait arriver à faire exécuter du code arbitraire à la Toolbar. La fonction en cause serait l'option "About" de la barre d'outils qui ne filtrerait pas correctement le code HTML. Une exploit est d'ores et déjà existante et a été testée sur les versions 2.0.114.1-big/en (GGLD) de la Google Toolbar. Aucune solution n'existe à ce jour. On peut imaginer que Google va sortir rapidement une nouvelle version de sa toolbar qui corrigera ce problème. Je ne mentionne pas la source de cette info car elle contient le code contenant l'exploitation de cette faille.
  8. Merci pour ces infos Cariboo. Il y a un gros manque d'info à ce niveau et également un manque de transparence de la part de Google sur l'utilisation réelle de ces technos dans leur système. Je cours de ce pas lire l'article !
  9. Bon et pour le contrôle PHP et à insérer en haut des pages PHP appelées : <? $host = getenv('HTTP_HOST'); if ((eregi("60gp",$host))) { header("Status: 301 Moved Permanently"); header("Location: http://www.7-dragons.com/"); exit(); } ?> Enjoy !
  10. Ah bon ? Curieux alors, j'avais déjà testé sans succès, peut être qu'il les ont en effet rajouté puisqu'à l'époque on m'avait répondu que ce n'était point possible (ils limitent je crois les ressources utilisés par le mod_rewrite pour pas qu'un ouf de type Thick leur casse les serveurs mutualisés ) Bon en fait le problème est que 60gp.ovh.net/~dragons/ et www.7-dragons.com sont le même site mais avec deux URLs donc différentes. Par je ne sais quel moyen, Google a indexé du 60gp alors qu'il n'aurait pas du. Manip de Thick pour dupliquer des URLs dans des concours de positionnement ? Résultat, il faut en effet tester le host pour envoyer une 301 ou pas vers la bonne URL. Dan, si tu es chaud pour la RewriteCond, je te laisse répondre puisque j'atteint mes limites là Sinon, il existe une autre solution consistant à mettre dans toutes les pages indexées par Google sous 60gp un petit script php qui va tester le host et renvoyer un header 301 + une redirection vers les bonnes URLs. Une fois une de ces deux moyens mis en place et comme les bots campent chez Thick, le problème sera réglé en deux jours pour la maj Google
  11. Nonon pas de problème si ca marche Par contre, il me semble que les RewriteCond sur les mutualisés OVH ne sont pas autorisées ...
  12. Thick, Sur OVH, reprends les mêmes règles que ton post ci dessus à part celle : RedirectPermanent / http://www.7-dragons.com/ et change seulement RedirectPermanent par Redirect permanent ... Ca devrait marcher .. ca a marcher pour moi
  13. Essaye : RedirectPermanent 60gp.ovh.net/~dragons/ http://www.7-dragons.com/
  14. Félicitations Jeff !! Que la petite Clara remplissent alors votre maison de bonheur :!: Allez hop , coupure de pc pendant 1 mois au moins
  15. 7 ou 8 parce que ca suffit à supporter une TRÉS grosse charge mais ce n'est en aucun cas une norme. Il y a plusieurs solutions techniques pour mettre en place un Load Balancing mais j'en retiendrais 2 principales : - Round Robin DNS qui consiste à faire du LB via un paramétrage spécifique des DNS qui se voit attribué une IP par nouveau serveur. La config DNS s'occupant ensuite de faire tourner le trafic sur l'un ou l'autre des servers. - Load Balancing Hardware consistant à la mise en place de matériels spécifiques (Cisco, Altéon, etc..) qui gère de manière plus efficace et précise un % de répartion de trafic sur les différents serveurs. Quelque soit les techniques mises en places, ce sont quand même des solutions assez lourdes (mais nécessaires).
  16. En tant que particulier, tu as effectivement bien le droit d'émettre une facture avec les mentions citées ci-dessus. Pour la TVA, tu n'y est pas assujettie en tant que particulier et prestations exceptionnelles mais tu dois porter la mention obligatoire suivante sur ta facture : T.V.A. non applicable, Article 293B du CGI Pour les conditions de réglement, tu peux demander par exemple un paiement par chèque à 30/60 jours à date de réception de ta facture. Si tu le souhaites, je peux t'envoyer un modele de facture édité par un particulier.
  17. Bonjour, Je n'ai jamais entendu parler de cette limite de 'saturation' pour Apache .. Même si c'est le cas, la solution serait alors de faire du Load Balancing en répartissant la charge sur deux serveurs Apache (ou plus selon le trafic). Il n'est pas étonnant de voir 7 ou 8 serveurs Apache tourner uniquement pour assurer une bonnne répartition du trafic de manière homogène et sans saturation.
  18. Ca pourrait être tout aussi bien ce qu'on appelle un piège à crawler Autant par le passé, c'est le genre de trucs qui pouvaient être marrants et marchaient bien, autant aujourd'hui, je pense que tous les bots ont des sortes de procédures de sécurité leur permettant de sortir de ce type de boucles infinies Mais c'est marrant à tester de temps à autres pour tester les outils clairement
  19. Merci pour le lien contenant les pdf et ppt, ils sont trés intéressants et permettront à certains d'entres nous de mieux comprendre le petit monde de l'information et des outils de recherche Bienvenue sur le Hub !
  20. Et une stratégie de linking interne payante ..
  21. Merci pour ces explications. Dans mon cas le <code> était le plus approprié. En testant, cela réduit d'ailleurs quelque peu la police. Mais finalement, j'ai opté pour ta dernière solution puisque cela semble plus approprié comme balise et qui finalement montre clairement la définition du concept. Je viens aussi d'aller voir ton lien, c'est vraiment excellent comme solution bien que dans mon cas, il ne s'agit pas de citation. En plus, je suppose que le css permettra de customiser encore plus cette fonctionnalité (la photo de l'auteur de la citation ? )
  22. Bonjour, En postant une news sur un de mes sites, j'ai eu besoin d'expliquer mais sans que cela nécessite la création d'une nouvelle page ou d'un glossaire la définition d'un mot. Pour cela, j'ai pensé à la balise acronym qui permet de faire afficher un petit texte d'explication lorsqu'on survole le mot en question. La balise title est bien effective et une infobulle s'affiche, seul souci, elle est tronquée et ne fait pas apparaitre le texte en entier qui consiste en deux lignes d'explication. Sous IE, aucun problème, les deux lignes sont bien affichées mais pas sous Firefox, ce qui m'ennuie quelque peu .. J'ai essayé avec le tag ABBR également (qui semble d'ailleurs plus correct qu'Acronym dans la bonne utilisation des balises dans le sens du W3C - confirmation ?-), mais rien n'y fait, cette tronquature est toujours présente. Connaissez vous des solutions pour ce problème là ? Merci d'avance !
  23. Re, Effectivement, pour arriver à le diffuser auprés du plus grand nombre, le php est plus abordable donc plus répandu, et ainsi préférable. Ceci dit, si tu créés une spécification et un format standard d'échange, c'est ce format de ce fichier qui va nous intéresser qu'il soit en PHP ou JSP devrait revenir à la même chose non ? Ton idée de faire le dev en C/C++ avec le front en PHP serait je trouve un trés bon compromis mais si j'ai bien compris ton projet, si tu as du dev en c/c++, tu pourrais aussi bien le faire en Java qu'en Perl ou autres. Car de la manière dont tu l'expliques, je vois un dev pour le backoffice et donc le coeur du système, et une interface de front qui te permet de diffuser tes résultats sur ton site mais aussi de le diffuser auprés de différents sites. Dans ce cas là, le choix du front n'a à mon avis que trés peu d'importance. Le fait de choisir PHP t'assurera pour sur une diffusion simple et rapide auprés de ta cible. Aprés pour le backoffice, c'est plus compliqué
  24. Dans ce cas, je te préconiserais plutôt Java qui a l'avantage par rapport aux PHP de pouvoir gérer tes différents modules de manières complètement indépendantes. De cette manière, ouvrir des sockets et les traiter en même tps en RAM peut etre fait réellement en parrallèle sans trop de surcharge là ou le php commencerait à être gourmand en ressources machines. De plus, sachant que tu auras des élèments en RAM, il sera plus facile de décider avec Java de laisser ces types de modules de manière statique ou pas, de vider les mémoires ou de leur allouer un certain espace, et de plus sera beaucoup plus sécurisé, chose que ne permet que plus légèrement PHP. Sécurité que ce soit au niveau applicatif ou externe. Ensuite je rajouterais aux nombreux avantages du Java, qu'étant du langage pré-compilé, tes applis seront plus rapides qu'avec PHP qui, lui, va toujours devoir passer par son interpréteur. En plus de la rapidité, cela te permettra d'envisager des montées en charge plus importantes là ou le PHP saturerait à mon avis assez rapidement. PHP est agréable pour programmer de petites applis pas trés complexe, mais dès qu'on veut monter des usines à gaz, Java lui sera toujours plus performant et efficace.
  25. Merci de nous faire une présentation détaillée afin de t'apporter une éventuelle réponse qui ne sera pas dans le vent Quel type d'applis dans le méta moteur de recherche, ouvre t-il des sockets ? y'a t il des fonctionnalités supplémentaires ? comment seront triés les résultats ? Vas tu utiliser un serveur ou plusieurs ? Bref + d'info pour + de réponse thx
×
×
  • Créer...