The time now is Wed 27 Jan 2021, 06:46
All times are UTC - 4 |
Author |
Message |
Pelo
Joined: 10 Sep 2011 Posts: 12591 Location: Mer méditerrannée (1 kms°)
|
Posted: Tue 12 Sep 2017, 00:50 Post subject:
mes travaux avec Puppy OCR. |
|
mes travaux avec Puppy OCR.
ROC : à voir, c'est une suggestion.
quel est le but : eviter de retaper un texte photographié pour gagner du temps. Si océriser va plus vite OK, si Océriser vous oblige à retaper les caractères bancales, vous allez vite renoncer.
Le plus rapide ? lire le texte à haute voix et vous enregistrer avec pRecord. et faites une video sur le sujet, avec des belles images.
Les pets sont fournis page 1. là j'ai des soucis avec la Puppy, plus de souris. Je vous laisse.
Description |
Textes anciens. |
Filesize |
104.07 KB |
Viewed |
275 Time(s) |

|
_________________ Passenger Pelo ! don't ask him to repair the aircraft. Don't use him as a demining dog .... pleeease.
|
Back to top
|
|
 |
Dorothée

Joined: 27 Nov 2012 Posts: 259
|
Posted: Fri 15 Sep 2017, 14:43 Post subject:
|
|
Pelo, merci pour toutes tes recherches, tu es une mine d'infos!
J'ai corrigé une petite erreur dans mon post plus haut. Le nom du fichier langue en anglais est eng.traineddata et non en.traineddata. Je continue mes essais.
Comme je l'ai écrit, la différence entre lepic2txt-batch et le pic2txt.pet (ou sfs) est que le premier permet de scanner d'un coup toutes les images d'un dossier, alors que le deuxième est une interface (gui) qui scanne les images une par une. Mais l'interface a un gros avantage, c'est que l'on peut changer le pourcentage - mais il ne faut pas oublier pour ça de monter imagechanger - et donc faire des essais (et ensuite modifier la taille de toutes les images en conséquence pour utiliser le batch?)
L'idéal serait d'inclure dans le script du batch la possibilité de changer la taille. Mais ça, je ne sais pas faire.
Tesseract a aussi une interface (gui), mais chez moi, pour une question que je n'ai pas résolue, ça ne marche pas.
PS: au fait, Pelo, puppyOCR est intéressant, mais il est basé sur.... tesseract.
|
Back to top
|
|
 |
Dorothée

Joined: 27 Nov 2012 Posts: 259
|
Posted: Fri 15 Sep 2017, 23:05 Post subject:
|
|
Continuant mes recherches, j'ai trouvé comment redimensionner toutes les images d'un même dossier.
C'est avec imagemagick.
Voici la marche à suivre:
1) Monter imagemagick (en sfs ou le pet)
2) Mettre toutes les images dans un dossier
3) Ouvrir un terminal dans ce dossier (clic droit fenêtre terminal ici)
4) taper Code: | mogrify -resize %requis *.tif (selon le format d'image) |
exemple: Code: | mogrify -resize 50% *.tif |
ATTENTION: Si l'on s'arrête là, les images SONT REMPLACÉES PAR LES NOUVELLES.
Il faut donc donner le chemin d'un dossier de destination
exemple: Code: | mogrify -resize 50% *.tif -path /root/images50pc/
|
(il y a aussi "convert" - voir la page ubuntu citée plus bas)
Cela m'a permis de résoudre mon problème. Je teste d'abord quel est le meilleur pourcentage de mes images pour la reconnaissance de caractère (avec Tesseract et l'interface pic2txt), ensuite je redimensionne les images avec imagemagick, et enfin je scanne le tout avec le batch pic2txt-batch (voir mon post au-dessus)
Un peu fastidieux certes, il y a sûrement mieux, mais efficace.
J'en profite pour faire la pub d'imagemagick, dont vous trouverez toutes les fonctions (impressionnantes!) ici: https://doc.ubuntu-fr.org/imagemagick
Tout est en ligne de commande, mais pour les anciens ouindozeurs comme moi, c'est un bon exercice.
À bientôt.
|
Back to top
|
|
 |
Pelo
Joined: 10 Sep 2011 Posts: 12591 Location: Mer méditerrannée (1 kms°)
|
Posted: Fri 15 Sep 2017, 23:57 Post subject:
PuppyOCR est basé sur Tesseract |
|
Comme pas mal d'appications Puppy, PuppyOCR est basé sur Tesseract certes, mais en l'améliorant, en l'allégeant et en le rendant convivial.
Vous allez devoir linuxer pour adapter vos logiciels à votre Puppy. Alors que de braves gens l'ont déjà fait pour vous, avec Puppy OCR, dans le temps, quand ils étaient patients.
Mais ce sont des mots. Si vous voulez pas l'essayer, vous saurez jamais.
Pas mal de linuxiens ne veulent pas de Puppy, trop petit, pas assez cher, mon fils. Mais vous , Mais toi, DOOroothée ?
_________________ Passenger Pelo ! don't ask him to repair the aircraft. Don't use him as a demining dog .... pleeease.
|
Back to top
|
|
 |
Dorothée

Joined: 27 Nov 2012 Posts: 259
|
Posted: Sat 16 Sep 2017, 01:48 Post subject:
|
|
Tu as raison Pelo, c'est mieux quand on trouve des applications clé en main. Mais en matière de Puppy, ou linux, ça ne marche pas toujours comme sur des roulettes. En ce qui me concerne, j'ai des applications-phares, qui tournent toutes seules, et puis de temps en temps, je bidouille. Ça aiguise ma curiosité, me fait apprendre un peu, c'est sympa.
Quant à Puppy, l'essayer, c'est l'adopter!
|
Back to top
|
|
 |
augras
Joined: 11 Nov 2013 Posts: 1492 Location: france
|
Posted: Sat 16 Sep 2017, 04:58 Post subject:
|
|
Dorothée wrote: | Continuant mes recherches, j'ai trouvé comment redimensionner toutes les images d'un même dossier.
|
Bonjour Dorothée,
Il y a beaucoup plus simple en utilisant Peasyscale de l'ami rcrsn51 : http://www.murga-linux.com/puppy/viewtopic.php?p=617584
C'est tout simplement... hyper simple et efficace, image par image ou bien dossier complet.
Pour l'ocr je n'y connais rien.
Philippe
|
Back to top
|
|
 |
Dorothée

Joined: 27 Nov 2012 Posts: 259
|
Posted: Sat 16 Sep 2017, 05:34 Post subject:
|
|
Augras, merci pour le tuyau, d'autant que peasyscale est déjà installé sur Precise (ou en tout cas Triton).
C'est très pratique, c'est vrai. Le seul hic, c'est que la version que j'ai n'a l'air de traiter que les jpg, et que l'ocr se fait avec des images au format tif. Il faut que je l'actualise.
On avance, on avance...
|
Back to top
|
|
 |
Dorothée

Joined: 27 Nov 2012 Posts: 259
|
Posted: Fri 29 Sep 2017, 01:31 Post subject:
|
|
Dans un post plus haut, j'ai commenté comment j'avais dribblé la restriction de langue du patch pic2txt-batch proposé par rscrnnn, en changeant fra.traineddata en eng.traineddata.
C'était évidemment du malabarisme, il y a plus simple et qui prête moins à confusion.
Si vous souhaitez utiliser pic2txt-batch en français (en mettant le fra.traineddata dans /usr/share/tessdata), il faut, après avoir décompacté pic2txt-batch.tar.gz dans /usr/bin/, ouvrir ce script et modifier la ligne 28 en remplaçant eng par fra.
Par contre, je ne sais pas comment faire pour gérer plusieurs langues.
À bientôt,
|
Back to top
|
|
 |
Argolance

Joined: 06 Jan 2008 Posts: 3822 Location: PORT-BRILLET (Mayenne - France)
|
Posted: Fri 29 Sep 2017, 17:10 Post subject:
|
|
Bonsoir,
Est-ce que par hasard, ça peut vous être utile?
Cordialement.
_________________
Puppy Search
|
Back to top
|
|
 |
Dorothée

Joined: 27 Nov 2012 Posts: 259
|
Posted: Fri 29 Sep 2017, 18:24 Post subject:
|
|
Merci,
je vais y faire un tour et rendre compte de mes expériences.
À bientôt,
|
Back to top
|
|
 |
Dorothée

Joined: 27 Nov 2012 Posts: 259
|
Posted: Fri 29 Sep 2017, 20:25 Post subject:
|
|
Après plusieurs tentatives, j'ai décidément du mal avec les interfaces graphiques (gui), auxquelles il manque toujours des librairies.
Mais je commence à m'en sortir assez bien avec la ligne de commande, et pour mon travail actuel, cela me convient.
En changeant un peu de sujet, quelqu'un peut-il me dire comment lister les librairies manquantes d'un logiciel dans la console? J'ai noté cela quelque part, mais je ne sais plus où.
Merci d'avance, à bientôt,
|
Back to top
|
|
 |
Pelo
Joined: 10 Sep 2011 Posts: 12591 Location: Mer méditerrannée (1 kms°)
|
Posted: Fri 29 Sep 2017, 23:40 Post subject:
ldd /usr/bin/osmo |
|
ldd le chemin du binaire
ldd /usr/bin/osmo
# ldd /usr/bin/osmo
linux-gate.so.1 => (0xffffe000)
libgtk-x11-2.0.so.0 => /usr/lib/libgtk-x11-2.0.so.0 (0xb731a000)
libgdk-x11-2.0.so.0 => /usr/lib/libgdk-x11-2.0.so.0 (0xb726b000)
libpangocairo-1.0.so.0 => /usr/lib/libpangocairo-1.0.so.0 (0xb725d000)
libgdk_pixbuf-2.0.so.0 => /usr/lib/libgdk_pixbuf-2.0.so.0 (0xb723c000)
libcairo.so.2 => /usr/lib/libcairo.so.2 (0xb7171000)
libpango-1.0.so.0 => /usr/lib/libpango-1.0.so.0 (0xb7127000)
libgobject-2.0.so.0 => /usr/lib/libgobject-2.0.so.0 (0xb70d9000)
.....
_________________ Passenger Pelo ! don't ask him to repair the aircraft. Don't use him as a demining dog .... pleeease.
|
Back to top
|
|
 |
Dorothée

Joined: 27 Nov 2012 Posts: 259
|
Posted: Sat 30 Sep 2017, 01:06 Post subject:
|
|
Merci Pelo,
au moins maintenant, je saurai ce qui manque. L'étape suivante sera de trouver ce qui manque...
À bientôt,
|
Back to top
|
|
 |
Argolance

Joined: 06 Jan 2008 Posts: 3822 Location: PORT-BRILLET (Mayenne - France)
|
Posted: Sat 30 Sep 2017, 06:58 Post subject:
|
|
Bonjour,
Je viens de compiler "ocrgui" (lien donné plus haut) et fait un fichier SFS, installé ImageMagick et tesseract ainsi que ses dépendances via le PPM (ToOpPy basée, comme Triton 5.0, sur Puppy Precise 5.7.1).
Et ça marche nickel!
Reste que l'interface est en anglais et que la seule langue disponible est l'italien, langue du concepteur Emanuele Sicchiero. Je vais donc faire la traduction et reviendrai rendre compte du résultat quand ce sera au point, car il y a des modifications à apporter ici et là pour que ça fonctionne, notamment le fichier desktop, sans quoi le programme n'apparait pas dans le MENU.
[EDIT]: Traduction effectuée!.
Cordialement.
Description |
|
Filesize |
77.56 KB |
Viewed |
100 Time(s) |

|
Description |
|
Filesize |
94.94 KB |
Viewed |
111 Time(s) |

|
_________________
Puppy Search
|
Back to top
|
|
 |
Dorothée

Joined: 27 Nov 2012 Posts: 259
|
Posted: Sat 30 Sep 2017, 22:38 Post subject:
|
|
Argolance, tu es top!
J'attends ton sfs avec impatience. Une interface graphique qui marche, quel luxe!
|
Back to top
|
|
 |
|
|
You cannot post new topics in this forum You cannot reply to topics in this forum You cannot edit your posts in this forum You cannot delete your posts in this forum You cannot vote in polls in this forum You cannot attach files in this forum You can download files in this forum
|
Powered by phpBB © 2001, 2005 phpBB Group
|