Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

reflexion sur conception d'un programme ? dur dur !!!

9 réponses
Avatar
martin
Bonjour,

Une des fonctionnalité d'Omnipage Pro permet de faire de l'OCR sur des
fichiers PDF, puis de les enregistrer en word (par exemple).

Nous souhaitons trouver une solution permettant à tout le monde (200
personnes) dans l'entreprise de convertir ces fichiers, sans devoir payer
200 licences utilisateurs.

Je reflechi au developpement d'une "paserelle" construite en 2 parties :


A: parti client

1. Un formulaire HTML, l'utilisateur indique son email, puis choisi son ou
ses fichiers pdf à traiter (upload).

2. Les infos et le/les fichier(s) arrivent sur le serveur.

3. On recupere les infos et on genere le fichiers XML qui servira pour le
traitement.


---------------------------------

B: parti traitement

1. Toute les 10 minutes, le script de traitement se lance
le script verifie si omnipage est actif ou non
si oui fin du script

2. si non on test si il y a des fichiers a traiter dans le repertoire R
si non fin du script

3. si oui, on change le fichier de repertoire, et on lance omnipage
une fois le travail d'omnipage effectué, il a genere un fichier word
dans un repertoire W
donc on kill omnipage (la version d'omnipage que laisse l'applicatif
ouvert une fois la convertion effectuée !)
on envoie un email a l'utilisateur avec son fichier word.

4. on recommence en 2.



------------------------------------------------------------

Que pensez vous de ceci ? le fait de separer en deux parti ?
Je pense developper ceci en python bien sur !!

9 réponses

Avatar
Jean-michel
Que pensez vous de ceci ? le fait de separer en deux parti ?


Bonsoir,
Pourquoi ne pas lancer ta chaîne directement avec un cgi ? Cela éviterait
toutes les manip de gestion de process. Un petit drapeau quelque part pour
sérialiser les requêtes, et le tour est joué. En plus, ton fichier sera
traité tout de suite, sans attendre les 10 mn.
Il faut gérer l'upload. Personnellement, je n'ai jamais fais.
A part ça, je ne vois pas de difficultés, sinon peut-être, si tu es sous
windows, la partie mail avec un fichier word attaché (le module email n'est
pas forcément évident à manipuler). Si ton serveur est sous unix, pas de pb,
il suffit d'utiliser la commande mail, avec peut-être avant un uuencode pour
attacher le fichier.

Je pense à un truc: il n'y a rien en open source qui te permet d'éviter
Omnipage ?

A+
jm

Avatar
martin
"Jean-michel" a écrit dans le
message de news:d29u4g$k9v$
Que pensez vous de ceci ? le fait de separer en deux parti ?


Bonsoir,
Pourquoi ne pas lancer ta chaîne directement avec un cgi ? Cela éviterait
toutes les manip de gestion de process. Un petit drapeau quelque part pour
sérialiser les requêtes, et le tour est joué. En plus, ton fichier sera
traité tout de suite, sans attendre les 10 mn.
Il faut gérer l'upload. Personnellement, je n'ai jamais fais.
A part ça, je ne vois pas de difficultés, sinon peut-être, si tu es sous
windows, la partie mail avec un fichier word attaché (le module email
n'est

pas forcément évident à manipuler). Si ton serveur est sous unix, pas de
pb,

il suffit d'utiliser la commande mail, avec peut-être avant un uuencode
pour

attacher le fichier.

Je pense à un truc: il n'y a rien en open source qui te permet d'éviter
Omnipage ?

A+
jm




J'ai bien pensé au cgi en python, mais je ne suis par parvenu a lancer
d'executable windows depuis mon cgi python, est ce possible ?
Je ne comprend pas "le petit drapeau pour serialiser les requetes ?"

Merci


Avatar
Jean-michel
J'ai bien pensé au cgi en python, mais je ne suis par parvenu a lancer
d'executable windows depuis mon cgi python, est ce possible ?
Oui. Tu peux essayer par exemple le plus simple:

from os import *
system("notepad")
Les fonctions "exec*()" donnent plus de possibilités. Tout est expliqué dans
la doc standard.
Attention, suivant la façon dont le serveur http est lancé, il peut être
bloquant de faire des IO écran/clavier. Si le process qui est lancé a besoin
d'afficher, il faut trouver une solution.

Je ne comprend pas "le petit drapeau pour serialiser les requetes ?"
Je parlais de ta partie B.1.

Cette partie est inutile si tu fais le traitement B dans la foulée du
traitement A. Le pb, c'est que si plusieurs utilisateurs cliquent en même
temps, soit ce sera la pagaille, soit ce sera compliqué à gérer. Pour régler
ça, il suffit d'attendre pour démarrer un traitement que le (éventuel) trt
précédent soit terminé. On peut faire ça en positionnant un indicateur (un
drapeau) quelque part dans un fichier pour se réserver l'exclusivité du trt.
Une fois celui-ci terminé, on enlève l'indicateur, et les autres (éventuels)
qui attendaient peuvent commencer, chacun positionnant le fameux drapeau
lorsqu'il démarre, et donc indiquant aux autres qu'ils doivent attendre.
Ceci n'est acceptable que si le trt est instantané, ce qui devrait être ton
cas.

S'il y a encore des choses obscures pour toi, il faut que tu précises mieux
le contexte et les prérequis. Par exemple, es-tu obligé d'utiliser IIS ?
Et aussi, est-ce que ça vaut le coup de faire tout ça ? Ne serait-il pas
plus avantageux de négocier une licence groupe pour Omnipage ?

A+
jm

Avatar
kaerbuhez
Bonjour,

Une des fonctionnalité d'Omnipage Pro permet de faire de l'OCR sur des
fichiers PDF, puis de les enregistrer en word (par exemple).

Nous souhaitons trouver une solution permettant à tout le monde (200
personnes) dans l'entreprise de convertir ces fichiers, sans devoir payer
200 licences utilisateurs.

Je reflechi au developpement d'une "paserelle" construite en 2 parties :

<snip>


As-tu bien vérifié que ta licence "un utilisateur" te permet de faire ça ?

Avatar
Ahmed MOHAMED ALI
Bonjour,
Si une connversion en texte vous suffit, vous pouvez utiliser ghostscript.
Cordialement,
Ahmed MOHAMED ALI

"martin" wrote in message
news:424863fd$0$805$
Bonjour,

Une des fonctionnalité d'Omnipage Pro permet de faire de l'OCR sur des
fichiers PDF, puis de les enregistrer en word (par exemple).

Nous souhaitons trouver une solution permettant à tout le monde (200
personnes) dans l'entreprise de convertir ces fichiers, sans devoir payer
200 licences utilisateurs.

Je reflechi au developpement d'une "paserelle" construite en 2 parties :


A: parti client

1. Un formulaire HTML, l'utilisateur indique son email, puis choisi son ou
ses fichiers pdf à traiter (upload).

2. Les infos et le/les fichier(s) arrivent sur le serveur.

3. On recupere les infos et on genere le fichiers XML qui servira pour le
traitement.


---------------------------------

B: parti traitement

1. Toute les 10 minutes, le script de traitement se lance
le script verifie si omnipage est actif ou non
si oui fin du script

2. si non on test si il y a des fichiers a traiter dans le repertoire R
si non fin du script

3. si oui, on change le fichier de repertoire, et on lance omnipage
une fois le travail d'omnipage effectué, il a genere un fichier word
dans un repertoire W
donc on kill omnipage (la version d'omnipage que laisse l'applicatif
ouvert une fois la convertion effectuée !)
on envoie un email a l'utilisateur avec son fichier word.

4. on recommence en 2.



------------------------------------------------------------

Que pensez vous de ceci ? le fait de separer en deux parti ?
Je pense developper ceci en python bien sur !!











Avatar
Do Re Mi chel La Si Do
Bonsoir !

Je pense que Martin ne veut pas générer du PDF, mais, au contraire, en
extraire le contenu.

@-salutations

Michel Claveau
Avatar
Ahmed MOHAMED ALI
Je pense que Martin ne veut pas générer du PDF, mais, au contraire, en
extraire le contenu.


Ghostcript le fait dans les deux sens.
Ahmed MOHAMED ALI

"Do Re Mi chel La Si Do" wrote in message
news:424c6783$0$854$
Bonsoir !

Je pense que Martin ne veut pas générer du PDF, mais, au contraire, en
extraire le contenu.

@-salutations

Michel Claveau





Avatar
F. Petitjean
Je pense que Martin ne veut pas générer du PDF, mais, au contraire, en
extraire le contenu.


Ghostcript le fait dans les deux sens.
Ahmed MOHAMED ALI


Je sais bien qu'on est le 1er avril, mais pourriez-vous préciser ?


Avatar
Ahmed MOHAMED ALI
Non,c'est pas un poisson d'avril.Pour convertir du pdf en text,il faut
utiliser pdf2ascii qui est fourni avec gs.Mais ça ne marche qu'avec du texte
pas avec les images.
Pour ces dernières(texte sous forme d'image),il faut utiliser un soft d'ocr.

Ahmed MOHAMED ALI


"F. Petitjean" wrote in message
news:424d0c97$0$2882$
Je pense que Martin ne veut pas générer du PDF, mais, au contraire, en
extraire le contenu.


Ghostcript le fait dans les deux sens.
Ahmed MOHAMED ALI


Je sais bien qu'on est le 1er avril, mais pourriez-vous préciser ?