Version complète: sur le forum Webmaster Hub : Espionner - Visualiser le contenu d'un site
Webmaster Hub > Informatique & Internet > PC-Gyver
DentsLongues
Salut, existe-t-il un moyen de visualiser tous les fichiers/dossier d'un site?

J'ai fait des recherches sur google avec les termes "racine", "répertoire" et "arborescence"... mais je n'ai pas trouvé d'indication pour apprendre à explorer un site et à trouver tous les documents qui s'y trouvent (images, pages, fichiers.)

Oui, je fais dans l'espionnage électronique!

hypocrite.gif

Tous les trucs sont les bienvenus, pour le moment je ne sais que:
- remonter l'url
- tester des noms de page à tâtons
- utiliser google > recherche avancée

Si vous connaissez ne serait-ce que les mots-clé à chercher dans google pour trouver des tutoriels, je suis preneur.
Théo B.
Je rappelle tout de meme qu'un contenu ne doit pas etre copié ou vu sans l'accord de son auteur...
De toutes façons, le serveur ne te donne que ce qu'il veut te donner.
Le code source te sera utile pour reconstituer une partie de l'arborescence du site (avec des aspirateurs comme FlashGet ça va vite). Tu n'auras que les fichiers "visibles".
Ensuite, tu peux toujours essayer de trouver "à taton" des fichiers invisibles sans lien, mais bon...Tu ne trouveras pas les fichiers interdits...
Et pour Google : l'interet est faible vu qu'avec flashget tu as toutes les pages backlinkées par le site lui meme.
DentsLongues
Merci pour cette réponse. Et en effet, tout ce que le serveur laisse voir est en principe ce qui est légitimement accessible.

Drôle de coincidence, je viens juste d'installer Flashget, il y a moins de deux heures (alors que je n'avais jamais entendu parlé de ce programme auparavant).

Flashget permet donc d'aspirer un site intégralement?

tongue.gif m'en vais testouiller ça!

ps: Quid des fichiers qui ne sont indiqués nulle part par un hyperlien?

[edit]

flashget ne trouve que le fichier index.htm

angry.gif
Wolf18
Salut, je t'ai envoyé un MP car je ne sais pas si le logiciel en question est très légal unsure.gif
petit-ourson
CITATION(DentsLongues @ samedi 22 avril 2006, 13h45)
ps: Quid des fichiers qui ne sont indiqués nulle part par un hyperlien?
*

Si les fichiers sont indiqués nulle part ... il ne pourra pas aller les chercher vu qu'il ne saura pas aller nulle part.

Edit : J'ai corrigé la grosse faute ;o)
DentsLongues
CITATION(Wolf18 @ samedi 22 avril 2006, 14h42)
Salut, je t'ai envoyé un MP car je ne sais pas si le logiciel en question est très légal  unsure.gif
*
Oui, je suis en train de vérifier "*************". Merci beaucoup!
CITATION(petit-ourson @ samedi 22 avril 2006, 15h00)
Si ls fichiers sont indiqués nul part ... il ne pourra pas aller les chercher vu qu'il ne saura pas aller nul part.
*
PS: ne pas oublier de mettre l'adverbe au féminin svp! "nulle part" rolleyes.gif

J'ai testé ************* sur un site dont je connais les pages secrètes... Bien que ce logiciel ne permette pas d'accéder aux fichiers non "hyper-liés", il est néanmoins génialissime car il permet de pénétrer dans un site internet et d'en zieuter le contenu d'un coup. Idéal pour repérer un truc en particulier, plutôt que d'y passer des plombes. smile.gif

Merci Wolf18! IMSTP2.gif
Wolf18
Mais de rien !

Et puis tu n'aurais pas non plus accès aux dossier protégés par des .htaccess, mais bon c'est assez pratique comme programme tongue.gif
Sebastien
Tu peux essayer eventuellement de regarder les contenus des repertoires mal protégés. S'il n'y a pas de fichier index tu verra alors les divers fichiers du repertoire.

Le fichier robots.txt peut également donner des indications sur les contenus que le webmaster ne veut pas voir indexés.
DentsLongues
CITATION(Sebastien @ samedi 22 avril 2006, 17h14)
Tu peux essayer eventuellement de regarder les contenus des repertoires mal protégés. S'il n'y a pas de fichier index tu verra alors les divers fichiers du repertoire.

Le fichier robots.txt peut également donner des indications sur les contenus que le webmaster ne veut pas voir indexés.
*
hum, donc pour regarder le contenu de ces répertoires mal protégés, je fais comment? J'entre un nom de dossier en croisant les doigts pour qu'il ne contienne pas d'index.htm, c'est ça?
www.NDD.com / répertoiremalprotégé
Parfois en effet lors de mes tests d'apprenti espion, je tape un nom de dossier (donc, en général un terme fréquent sur le site SANS .htm à la fin) et je tombe sur une sorte de répertoire / liste avec par exemple, des mp3 ou des fichiers à télécharger. C'est de ça que tu parles?

Où se trouve le fichier robots.txt en général? Je croyais que les robots n'étaient influencés que par un bout de code à l'intérieur de chaque page html...
Sebastien
Le fichier robots.txt se place à la racine du site, exemple pour Google : http://www.google.fr/robots.txt

Quand au repertoire, voici un exemple sur mon site, volontairement accessible : -http://s.billard.free.fr/divers/
AlphaDesign
Un bon aspirateur de sites web: http://www.httrack.com/
Dudu
Bonjour
CITATION(virtuelBlue @ lundi 24 avril 2006, 15h34)
Un bon aspirateur de sites web: http://www.httrack.com/
*
.. blacklisté par de nombreux sites parce que sa configuration par défaut "bouffe" trop de pages à la minute (et qu'il n'y a rien de tel pour faire tomber un petit serveur qui ne s'y attend pas)

Je le précise pour info wink.gif
DentsLongues
CITATION(Dudu @ lundi 24 avril 2006, 17h11)
.. blacklisté par de nombreux sites...

Ca veut dire qu'il vaut mieux en utiliser un autre qui bouffe les pages moins rapidement / avec plus de délicatesse? huh.gif

Quel pourraient-être les autres choix de bons aspirateurs / farfouilleurs?
AlphaDesign
Peut-être Getleft, que tu trouveras en bas de cette page http://www.snapfiles.com/Freeware/downloader/fwoffline.html... mais je ne l'ai jamais essayé...
Ceci est une version "bas débit" de notre forum. Pour voir la version complète avec plus d'information, la mise en page et les images, veuillez cliquer ici.