Outils pour utilisateurs

Outils du site


issue95:able2extract

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
issue95:able2extract [2015/04/17 16:28] d52frissue95:able2extract [2015/04/18 14:46] (Version actuelle) andre_domenech
Ligne 17: Ligne 17:
 Using the OCR took a little while to figure out, but you just convert the image to a PDF, or print the image to a PDF.** Using the OCR took a little while to figure out, but you just convert the image to a PDF, or print the image to a PDF.**
  
-Bien qu'il soit possible d'extraire du texte d'un fichier PDF en copiant/collant une sélection, celà ne marche pas toujours comme prévu. Ainsinous pouvons perdre le format. Able2Extract Professional 9 peut faire tout celà et encore plus. A l'intérieur de la version Pro a été mis en place un dispositif OCR plutôt impressionnant qui peut extraire du texte des images.+Bien qu'il soit possible d'extraire du texte d'un fichier PDF en copiant/collant une sélection, cela ne marche pas toujours comme prévu. En plus, le formatage se perd parfois. Able2Extract Professional 9 peut faire tout cela et encore plus. A l'intérieur de la version Pro a été mis en place un dispositif OCR plutôt impressionnant qui peut extraire du texte des images.
  
 Installation Installation
  
-L'installation d'Able2Extract est assez simple. Vous téléchargez le chier .deb Ubuntu/Debian, vous double-cliquez dessus et laissez-le s'installer. Si vous avez une clé pour le déploquer, vous pouvez la saisir après l'installation.+L'installation de Able2Extract est assez simple. Vous téléchargez le fichier .deb Ubuntu/Debian, vous double-cliquez dessus puis laissez-le s'installer. Si vous avez une clé pour le débloquer, vous pouvez la saisir après l'installation.
  
 Utilisation Utilisation
  
-À la première utilisation, vous êtes accompagnés pas-à-pas pour ouvrir un fichier et le convertir en texte. En bref, vous opérer dans le menu, de gauche à droite.+À la première utilisation, vous êtes accompagné pas à pas pour ouvrir un fichier et le convertir en texte. En bref, vous parcourez le menu, de gauche à droite.
  
 Les étapes : Les étapes :
 • Ouvrir un fichier (PDF ou texte) ; • Ouvrir un fichier (PDF ou texte) ;
 • sélectionner une zone (tout ou une zone définie) ; • sélectionner une zone (tout ou une zone définie) ;
-• sélectionner un format de sortie (HTML, imageet Calc et Writer de LibreOffice sont supportés) ;+• sélectionner un format de sortie (HTML, image et Calc et Writer de LibreOffice sont supportés) ;
 • sauvegardez. • sauvegardez.
  
-L'utilisation de l'OCR demande un temps de compréhension, mais vous convertissez seulement l'image en PDFou imprimez l'image dans un PDF.+L'utilisation de l'OCR demande un temps de compréhension, mais il suffit de convertir l'image en PDF ou d'imprimer l'image dans un PDF.
  
 **PDF to Text **PDF to Text
Ligne 49: Ligne 49:
 PDF vers texte PDF vers texte
  
-Après avoir ouvert FCM n°94 (page précédente, image du haut à droite), j'ai sauté à la page 13 et j'ai sélectionné les premières colonnes de texte. Ça sélectionne aussi l'image aussi, avec ceci, j'ai cliqué sur le bouton OpenOffice (ne devrais-je pas dire LibreOffice ?). Dans le pop-up, j'ai cliqué sur le bouton « Convert » sous Writer pour obtenir un fichier ODT.+Après avoir ouvert le FCM n° 94 (page précédente, image en haut à droite), j'ai sauté à la page 13 et j'ai sélectionné les trois premières colonnes de texte. L'image aussi été sélectionnée ; je n'ai pas protesté et j'ai cliqué sur le bouton OpenOffice (ne devrait-on pas dire LibreOffice ?). Dans le pop-up, j'ai cliqué sur le bouton « Convert » sous Writer pour obtenir un fichier ODT.
  
-Le fichier ODT est sauvegardé et il est ouvert automatiquement dans LibreOffice Writer.+Le fichier ODT est sauvegardé puis ouvert automatiquement dans LibreOffice Writer.
  
-Bien que la sortie (page précédente, image du bas à droite) ne soit pas identique au PDF, il a conservé l'entête et les couleurs du texte, ce qui est bien.Même les lignes verticales pointillées ont été conservées. La lettrine a été éliminée des premières lignes, mais la sortie dans son ensemble est encore très utilisable.+Bien que la sortie (page précédente, image en bas à droite) ne soit pas identique au PDF, il a conservé l'en-tête et les couleurs du texte, ce qui est bien. Même les lignes verticales pointillées ont été conservées. La lettrine des deux premières lignes a causé quelques dégâts dans ces deux même lignes, mais la sortie dans son ensemble est encore très utilisable.
  
-J'ai remarqué que même avec des petits fichiers PDF, comme FCM (10Mo), celà prend quelques secondes pour dérouler tout le PDF.+J'ai remarqué quemême avec des petits fichiers PDF, comme le FCM (10 Mo), il lui faut quelques secondes pour parcourir tout le PDF.
  
-Moyennant quoi, récupérer le texte d'un PDF n'a rien d'impressionnant.Il est temps que l'OCR montre qu'on en a pour son argent.+De toutes façons, récupérer le texte d'un PDF n'a rien d'impressionnant. Il est temps que l'OCR montre qu'on en a pour son argent.
  
 **Image To Text **Image To Text
Ligne 77: Ligne 77:
 Image vers texte Image vers texte
  
-Voyant qu'il pouvait gérer Calc, J'ai décidé d'être plus pernicieux et de convertir une table dans une image au format Calc.+Voyant qu'il pouvait gérer Calc, j'ai décidé d'être plus pernicieux et de convertir une table contenue dans une image au format Calc.
  
-Sera-t-il capable de lire le texte dans une image, de le rendre éditable et de le conserver dans un format de table décent ?+Sera-t-il capable de lire le texte dans une image, de le rendre modifiable et de le conserver dans un format de table décent ?
  
-La réponse est résolument oui ! Bien qu'un peu de texte soit un peu détérioré, il faut dire que l'original était un PDF imprimé, scanné et retransformé à nouveau en PDF ; la qualité a quelque peu souffert.+La réponse est résolument oui ! Bien que du texte soit un peu détérioré, il faut dire que l'original était un PDF imprimé, scanné et retransformé à nouveau en PDF ; la qualité a quelque peu souffert.
  
-Ce serait certainement facile de convertir cette sortie Calc en table qui ressemblerait à l'original.+Ce serait certainement facile de convertir cette sortie Calc en une table qui ressemblerait à l'original.
  
-Que devient une image d'un texte transformée en texte éditable ?+Que devient l'image d'un texte après transformation en texte éditable ?
  
-Oui ! +Oui ! J'aime comment il le convertit en un texte éditable, réalisant un excellent travail en conservant même les en-têtes en gras. Ce n'est pas simplement un paquet en texte brut. Il essaie réellement de copier le format de l'original.
- +
-J'aime comment il le convertit en un texte éditable, réalisant un excellent travail en conservant même les entêtes en gras. Ce n'est pas simplement un paquet en texte brut. Il réellement essayé de copier le format de l'original.+
  
  
Ligne 109: Ligne 107:
  
 Download trial from: http://www.investintech.com/prod_downloadsa2e_pro.htm** Download trial from: http://www.investintech.com/prod_downloadsa2e_pro.htm**
 +
 +Conclusion
 +
 +Bien entendu, il n'est pas infaillible. Donnez-lui un fond coloré avec un texte blanc et je suis à peu près sûr qu'il échouera, tout comme la plupart des applications OCR. J'ai été particulièrement impressionné du peu d'erreurs trouvées dans la conversion d'une image de bonne qualité en texte éditable.
 +
 +Si vous avez des images de haute qualité que vous voulez reconvertir en texte, alors cette application est réellement une de celles à envisager. Félicitations à Investintech d'avoir publié une version Linux de leur application.
 +
 +
 +Exigences pour un système Linux
 +
 +OS : Linux Fedora 20 ou plus récent, Ubuntu 13.10 ou plus récent, en édition 32-bit.
 +
 +RAM : 512 Mo ou + de mémoire disponible pour le logiciel.
 +
 +Espace sur le disque dur : 250 Mo d'espace disque pour les composants du programme.
 +
 +Affichage : Résolution d'écran 1366 (largeur) x 768 (hauteur).
 +
 +Version d'essai à télécharger sur : http://www.investintech.com/prod_downloadsa2e_pro.htm
  
  
Ligne 120: Ligne 137:
  
 Deadline for entries is Sunday 19th April. Five winners will be drawn at random.** Deadline for entries is Sunday 19th April. Five winners will be drawn at random.**
 +
 +CONCOURS :
 +
 +Pour gagner l'une des cinq clés sans limitation de temps de Able2Extract Professional 9, tout ce que vous avez à faire est de répondre à la question suivante :
 +
 +Que veut dire OCR ?
 +
 +Envoyez votre réponse par mail à : misc@fullcirclemagazine.org, au plus tard le dimanche 19 avril.
 +
 +Cinq gagnants seront tirés au sort.
issue95/able2extract.1429280916.txt.gz · Dernière modification : 2015/04/17 16:28 de d52fr