La partie récupération du titre ou de la description est relativement facile. Il suffit de:
- récupérer la page. Plein de méthodes pour ça en php, la plus simple étant probablement
file_get_contents, mais si tu veux récupérer les headers (ce qui est indispensable, voir ci-dessous) ça va être un peu plus compliqué (fopen + stream_get_meta_data).
- interpréter le contenu de la page, l'idéal étant d'utiliser un vrai parser HTML, mais une paire de regex bien senties font l'affaire dans la plupart des cas.
Ne pas oublier de vérifier le charset dans le Content-Type (dans les headers et/ou le meta http-equiv) et de convertir l'encodage comme il faut, et de gérer les entités HTML (&machin;) évidemment.
Pour le screenshot, c'est nettement plus compliqué, puisqu'il faut un moteur complet de rendu HTML (+CSS +JS +Flash +plein d'autres choses). Effectivement la plupart des sites utilisent des solutions externes telles que citées par KaRaK (il me semble qu'il y en a encore une ou deux autres). Pendant longtemps c'était assez tordu à faire, il me semble que récemment il y a eu des progrès de ce côté et qu'il y a un moyen de linker le moteur de rendu de FF (ou est-ce Konqueror?) à travers une librairie, mais ça reste quand même non trivial, et si la partie "je récupère le titre de la page" te paraît compliqué, tu peux probablement oublier tout de suite...
Jacques.