J'ai chaque jour un contenu textuel sous forme de log, avec des lignes du genre :
CODE
date_AT_parametre_AT_contenu1_AT_contenu2@@\n
Le parametre fait 10-30 caracteres, le contenu 1 20-50 cars, le contenu 2 0 - 600 cars.
J'ai de 30 000 à 100 000 lignes de ce genre, et le fichier total produit chaque jour fait dans les 100-200 Mo.
Ca c'est le gros morceau.
Par ailleurs, j'ai un fichier d'environ 4000 "expressions", à remplacer par leur équivalent protégé dans le fichier d'au dessus.
Par exemple, j'ai l'expression "mot1 mot2", et je veux remplacer dans chaque ligne du fichier "mot1 mot2" par "mot1+mot2".
X 4000 expressions, X 50 000 lignes, je vous fais pas de dessin, avec un script php, meme optimisé au max (pas de regex, traitement par ligne, une array des expressions, boucle au plus simple) le dedie appelle le SAMU.
Je sais pas par quel bout prendre le probleme :
script shell, avec awk, avec autre chose ?
script perl ? php en cli ?
Je connais correctement php, et pas grand chose d'autre en prog, je suis pret a apprendre les rudiments d'un autre langage, mais je sais pas lequel
Des conseils la dessus ?
Les 4000 expressions sont fixes (meme si j'en ajoute, je me passerais d'un update complet de tous les fichiers précédents), le fichier est diférent et produit chaque jour par un de mes sites.