Webmaster Hub: Capture d'images et données en automatique - Webmaster Hub

Aller au contenu

Page 1 sur 1
  • Vous ne pouvez pas commencer un sujet
  • Vous ne pouvez pas répondre à ce sujet

Capture d'images et données en automatique Dans la veine d'un annuaire... Noter : -----

#1 L'utilisateur est hors-ligne   Dimitri 

  • Groupe : Membre
  • Messages : 15
  • Inscrit(e) : 02-septembre 09

Posté 23 novembre 2009 - 13:12

Bonjour,

Je cherche à mettre en place une fonction qu'on retrouve sur certains annuaire, à savoir le client entre une adresse de site internet et mon site récupérerait un visuel de la page concernée ainsi que certaines données classiques comme le titre et la description.

Cela doit être assez basique comme codage mais je ne sais pas quelle fonction utiliser.

Pourriez-vous m'aiguiller ? :whistling:
0

#2 L'utilisateur est hors-ligne   KaRaK 

  • Groupe : Membre+
  • Messages : 738
  • Inscrit(e) : 14-juillet 05
  • Localisation:Lille

Posté 23 novembre 2009 - 14:41

Bonjour,

Générallement les annuaires utilisent des solutions externes comme AscreeN, Thumbshots ou bien encore Alexa.

Tu cherches à développer ta propre solution ?
3 liens pour référenceur coquin
Le site Outil Référencement : un vieux site sur le SEO.
Création de trafic avec Oseox (Tutoriels Référencement, Adwords et Développement web)
Actualité Web Marketing et Search Marketing : Blog Referencement encore un !
0

#3 L'utilisateur est en ligne   jcaron 

  • Groupe : Membre+
  • Messages : 844
  • Inscrit(e) : 15-janvier 08
  • Genre:Homme
  • Localisation:Londres

Posté 23 novembre 2009 - 18:08

La partie récupération du titre ou de la description est relativement facile. Il suffit de:
- récupérer la page. Plein de méthodes pour ça en php, la plus simple étant probablement file_get_contents, mais si tu veux récupérer les headers (ce qui est indispensable, voir ci-dessous) ça va être un peu plus compliqué (fopen + stream_get_meta_data).
- interpréter le contenu de la page, l'idéal étant d'utiliser un vrai parser HTML, mais une paire de regex bien senties font l'affaire dans la plupart des cas.

Ne pas oublier de vérifier le charset dans le Content-Type (dans les headers et/ou le meta http-equiv) et de convertir l'encodage comme il faut, et de gérer les entités HTML (&machin;) évidemment.

Pour le screenshot, c'est nettement plus compliqué, puisqu'il faut un moteur complet de rendu HTML (+CSS +JS +Flash +plein d'autres choses). Effectivement la plupart des sites utilisent des solutions externes telles que citées par KaRaK (il me semble qu'il y en a encore une ou deux autres). Pendant longtemps c'était assez tordu à faire, il me semble que récemment il y a eu des progrès de ce côté et qu'il y a un moyen de linker le moteur de rendu de FF (ou est-ce Konqueror?) à travers une librairie, mais ça reste quand même non trivial, et si la partie "je récupère le titre de la page" te paraît compliqué, tu peux probablement oublier tout de suite...

Jacques.
0

#4 L'utilisateur est hors-ligne   Dimitri 

  • Groupe : Membre
  • Messages : 15
  • Inscrit(e) : 02-septembre 09

Posté 23 novembre 2009 - 18:11

Vu que j'aime bien tout maitriser et maitriser par l'apprentissage, oui je comptais faire tout par moi-même.

Après vu ce que vous me donnez comme indication, il faut que je vois si c'est à ma portée. Merci pour les orientations. Je vais creuser le sujet et je reviens vers vous pour de plus amples questions. :hypocrite:
0

Partager ce sujet :


Page 1 sur 1
  • Vous ne pouvez pas commencer un sujet
  • Vous ne pouvez pas répondre à ce sujet

1 utilisateur(s) en train de lire ce sujet
0 membre(s), 1 invité(s), 0 utilisateur(s) anonyme(s)