Webmaster Hub: Regex nettoyage de fichier URLs - Webmaster Hub

Aller au contenu

Page 1 sur 1
  • Vous ne pouvez pas commencer un sujet
  • Vous ne pouvez pas répondre à ce sujet

Regex nettoyage de fichier URLs Besoin d'aide pour une expression régulière Noter : -----

#1 L'utilisateur est hors-ligne   karnabal 

  • Groupe : Fondateur
  • Messages : 2 026
  • Inscrit(e) : 11-novembre 05
  • Genre:Homme
  • Localisation:47 boulevard de Ménilmontant, Paris
  • Société:GRAPHIC INSTINCT

Posté 15 février 2011 - 11:56

Bonjour,

Besoin d'un coup de main pour une regex.

Citation

1 blabla bla
1. -http://www.sartim-internet.com/
2. -http://pixeltrame.com/blog/
4. -http://www.rtum.com
5. -http://fatalz.com/
25. -http://blartz.com/
98- -http://www.traiaman.co.co
99- -http://blank.blogspot.com
100- -http://allinhome.com/
101- -http://www.bootca.com/blog/


Je voudrais obtenir ça (bon, s'il reste la première ligne je prends quand même !) :

Citation

-http://www.sartim-internet.com/
-http://pixeltrame.com/blog/
-http://www.rtum.com
-http://fatalz.com/
-http://blartz.com/
-http://www.traiaman.co.co
-http://blank.blogspot.com
-http://allinhome.com/
-http://www.bootca.com/blog/


Voilà ma regex (([0-9]*)(\s|-\s))|([0-9]*)\. mais elle prend en compte tous les points ! :(

Help! :)

PS : les tirets avant les http ne sont mis ici que pour éviter de créer les liens hypertextes ; faire comme s'ils n'existaient pas pour la regex. ;)
Assurance frontalier : pour des travailleurs frontaliers bien assurés - Electricien Annecy : électricité générale et expert en pose de panneaux solaires photovoltaïques - Webmaster Paris : création de site internet
0

#2 L'utilisateur est hors-ligne   captain_torche 

  • Danacol / Orangina rouge
  • Voir le blog
  • Groupe : Admin
  • Messages : 6 722
  • Inscrit(e) : 08-février 06
  • Genre:Homme
  • Localisation:Savigny / Orge

Posté 15 février 2011 - 12:25

Pour faire plus simple, tu ne veux pas supprimer tout ce qui serait avant l'espace ?
genre (Sans tester, attention) :
#(.* )(.*)#

Vous avez rêvé cette nuit ? Partagez vos rêves sur l'Onironaute !
Bijoux fantaisie
Recherche nounou
0

#3 L'utilisateur est hors-ligne   karnabal 

  • Groupe : Fondateur
  • Messages : 2 026
  • Inscrit(e) : 11-novembre 05
  • Genre:Homme
  • Localisation:47 boulevard de Ménilmontant, Paris
  • Société:GRAPHIC INSTINCT

Posté 15 février 2011 - 12:47

Ouais, c'est pas bête, mais à vrai dire je cherchais à comprendre pourquoi tous les points étaient pris en compte.

Ceci dit, je ne vois pas où sont mentionnés les espaces dans ta regex Marc.
Assurance frontalier : pour des travailleurs frontaliers bien assurés - Electricien Annecy : électricité générale et expert en pose de panneaux solaires photovoltaïques - Webmaster Paris : création de site internet
0

#4 L'utilisateur est hors-ligne   captain_torche 

  • Danacol / Orangina rouge
  • Voir le blog
  • Groupe : Admin
  • Messages : 6 722
  • Inscrit(e) : 08-février 06
  • Genre:Homme
  • Localisation:Savigny / Orge

Posté 15 février 2011 - 12:57

j'ai mis un espace "simple" à la fin de la première parenthèse capturante. On pourrait aussi mettre un "\s", mais en faisant attention de traiter chaque ligne séparément.

Sinon, que veux-tu dire par "elle prend en compte tous les points" ?
Vous avez rêvé cette nuit ? Partagez vos rêves sur l'Onironaute !
Bijoux fantaisie
Recherche nounou
0

#5 L'utilisateur est hors-ligne   karnabal 

  • Groupe : Fondateur
  • Messages : 2 026
  • Inscrit(e) : 11-novembre 05
  • Genre:Homme
  • Localisation:47 boulevard de Ménilmontant, Paris
  • Société:GRAPHIC INSTINCT

Posté 15 février 2011 - 13:54

Ok, je m'attendais effectivement à voir \s. ;)

Voilà pour les points, cf ci-dessous, ils sont tous en rouge, ce qu'il signifie qu'ils matchent avec la regex. Plop!

Image IPB

Est-ce assez clair ? :)
Assurance frontalier : pour des travailleurs frontaliers bien assurés - Electricien Annecy : électricité générale et expert en pose de panneaux solaires photovoltaïques - Webmaster Paris : création de site internet
0

#6 L'utilisateur est hors-ligne   captain_torche 

  • Danacol / Orangina rouge
  • Voir le blog
  • Groupe : Admin
  • Messages : 6 722
  • Inscrit(e) : 08-février 06
  • Genre:Homme
  • Localisation:Savigny / Orge

Posté 15 février 2011 - 14:12

Alors, la regex la plus simple qu'on puisse faire là-dessus, serait sans nul doute :
#(http.*)#

(On récupère tout ce qui commence par http)

Quant à la tienne, je n'avais pas compris que tu souhaitais supprimer les contenus correspondant au motif ;)
On pourrait envisager une regex de ce genre :
#([0-9]+[\.|-]?\s*)#

(On récupère tout ce qui est un ou plusieurs chiffres, suivis éventuellement par un point ou un tiret, ainsi que par un nombre indéterminé d'espaces).

http://lumadis.be/re...egex.php?id=673
Vous avez rêvé cette nuit ? Partagez vos rêves sur l'Onironaute !
Bijoux fantaisie
Recherche nounou
0

#7 L'utilisateur est hors-ligne   karnabal 

  • Groupe : Fondateur
  • Messages : 2 026
  • Inscrit(e) : 11-novembre 05
  • Genre:Homme
  • Localisation:47 boulevard de Ménilmontant, Paris
  • Société:GRAPHIC INSTINCT

Posté 15 février 2011 - 15:32

Merci pour ton aide et tes explications très complètes Marc ! :thumbsup: A relire, avec ta description, ça semble simple comme ça. :)
Assurance frontalier : pour des travailleurs frontaliers bien assurés - Electricien Annecy : électricité générale et expert en pose de panneaux solaires photovoltaïques - Webmaster Paris : création de site internet
0

#8 L'utilisateur est hors-ligne   alexfromfrance 

  • Groupe : Membre
  • Messages : 1
  • Inscrit(e) : 22-février 11
  • Société:Regsmith

Posté 22 février 2011 - 12:38

Si vous recherchez une regex plus restrictive pour une URL, vous pouvez aussi utiliser celle-ci qui est assez répandue et qui permet l'insertion d'un numéro de port dans la requête.

http://([^/:]+(:(\d+))?)(/.*)?


Cela permet par exemple http://www.domain.co.uk:8181/pathto/file?p=42, sans pour autant laisser filtrer certains URLs incorrectes.

Ce message a été modifié par Patrick - 22 février 2011 - 12:51.
Raison de l'édition : La publicité est interdite sur le Hub

RegSmith.com
Service pro d'expression régulières en ligne
0

Partager ce sujet :


Page 1 sur 1
  • Vous ne pouvez pas commencer un sujet
  • Vous ne pouvez pas répondre à ce sujet

1 utilisateur(s) en train de lire ce sujet
0 membre(s), 1 invité(s), 0 utilisateur(s) anonyme(s)