Jump to content

pdf to text


cybermad
 Share

Recommended Posts

Bonsoir,

 

Je cale sur un truc.

j'ai besoin de récupérer du texte contenu dans un fichier php. J'ai testé avec
https://www.geeksforgeeks.org/how-to-read-pdf-file-using-php/
et
https://github.com/smalot/pdfparser
 

ça marche, je récupère bien tous les textes... mais à la queue leu leu et pas dans l'ordre.
il s'agit par ex de facture qui doivent être retraitées. J'ai besoin de récupérer des éléments de colonne description et rien de la colonne de prix et quantité.
Or ces scripts m'agglutinent les colonnes de droite (prix, quantité, etc...) tout à gauche avant la description et parfois après;

 

Une idée de comment faire svp  ?
Bon en plus les descriptions de sont jamais les mêmes donc dure avec les regex.

Merci par avance.

Link to comment
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
 Share

×
×
  • Create New...