Outils pour utilisateurs

Outils du site


issue95:able2extract

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
issue95:able2extract [2015/04/17 16:49] d52frissue95:able2extract [2015/04/18 14:46] (Version actuelle) andre_domenech
Ligne 17: Ligne 17:
 Using the OCR took a little while to figure out, but you just convert the image to a PDF, or print the image to a PDF.** Using the OCR took a little while to figure out, but you just convert the image to a PDF, or print the image to a PDF.**
  
-Bien qu'il soit possible d'extraire du texte d'un fichier PDF en copiant/collant une sélection, cela ne marche pas toujours comme prévu. Ainsinous pouvons perdre le format. Able2Extract Professional 9 peut faire tout cela et encore plus. A l'intérieur de la version Pro a été mis en place un dispositif OCR plutôt impressionnant qui peut extraire du texte des images.+Bien qu'il soit possible d'extraire du texte d'un fichier PDF en copiant/collant une sélection, cela ne marche pas toujours comme prévu. En plus, le formatage se perd parfois. Able2Extract Professional 9 peut faire tout cela et encore plus. A l'intérieur de la version Pro a été mis en place un dispositif OCR plutôt impressionnant qui peut extraire du texte des images.
  
 Installation Installation
Ligne 25: Ligne 25:
 Utilisation Utilisation
  
-À la première utilisation, vous êtes accompagnés pas-à-pas pour ouvrir un fichier et le convertir en texte. En bref, vous opérer dans le menu, de gauche à droite.+À la première utilisation, vous êtes accompagné pas à pas pour ouvrir un fichier et le convertir en texte. En bref, vous parcourez le menu, de gauche à droite.
  
 Les étapes : Les étapes :
 • Ouvrir un fichier (PDF ou texte) ; • Ouvrir un fichier (PDF ou texte) ;
 • sélectionner une zone (tout ou une zone définie) ; • sélectionner une zone (tout ou une zone définie) ;
-• sélectionner un format de sortie (HTML, imageet Calc et Writer de LibreOffice sont supportés) ;+• sélectionner un format de sortie (HTML, image et Calc et Writer de LibreOffice sont supportés) ;
 • sauvegardez. • sauvegardez.
  
-L'utilisation de l'OCR demande un temps de compréhension, mais vous convertissez seulement l'image en PDFou imprimez l'image dans un PDF.+L'utilisation de l'OCR demande un temps de compréhension, mais il suffit de convertir l'image en PDF ou d'imprimer l'image dans un PDF.
  
 **PDF to Text **PDF to Text
Ligne 49: Ligne 49:
 PDF vers texte PDF vers texte
  
-Après avoir ouvert FCM n°94 (page précédente, image du haut à droite), j'ai sauté à la page 13 et j'ai sélectionné les premières colonnes de texte. Ça sélectionne aussi l'image aussi, avec ceci, j'ai cliqué sur le bouton OpenOffice (ne devrais-je pas dire LibreOffice ?). Dans le pop-up, j'ai cliqué sur le bouton « Convert » sous Writer pour obtenir un fichier ODT.+Après avoir ouvert le FCM n° 94 (page précédente, image en haut à droite), j'ai sauté à la page 13 et j'ai sélectionné les trois premières colonnes de texte. L'image aussi été sélectionnée ; je n'ai pas protesté et j'ai cliqué sur le bouton OpenOffice (ne devrait-on pas dire LibreOffice ?). Dans le pop-up, j'ai cliqué sur le bouton « Convert » sous Writer pour obtenir un fichier ODT.
  
 Le fichier ODT est sauvegardé puis ouvert automatiquement dans LibreOffice Writer. Le fichier ODT est sauvegardé puis ouvert automatiquement dans LibreOffice Writer.
  
-Bien que la sortie (page précédente, image du bas à droite) ne soit pas identique au PDF, il a conservé l'entête et les couleurs du texte, ce qui est bien. Même les lignes verticales pointillées ont été conservées. La lettrine des premières lignes a été éliminée, mais la sortie dans son ensemble est encore très utilisable.+Bien que la sortie (page précédente, image en bas à droite) ne soit pas identique au PDF, il a conservé l'en-tête et les couleurs du texte, ce qui est bien. Même les lignes verticales pointillées ont été conservées. La lettrine des deux premières lignes a causé quelques dégâts dans ces deux même lignes, mais la sortie dans son ensemble est encore très utilisable.
  
-J'ai remarqué que même avec des petits fichiers PDF, comme FCM (10Mo), cela prend quelques secondes pour dérouler tout le PDF.+J'ai remarqué quemême avec des petits fichiers PDF, comme le FCM (10 Mo), il lui faut quelques secondes pour parcourir tout le PDF.
  
-Moyennant quoi, récupérer le texte d'un PDF n'a rien d'impressionnant. Il est temps que l'OCR montre qu'on en a pour son argent.+De toutes façons, récupérer le texte d'un PDF n'a rien d'impressionnant. Il est temps que l'OCR montre qu'on en a pour son argent.
  
 **Image To Text **Image To Text
Ligne 79: Ligne 79:
 Voyant qu'il pouvait gérer Calc, j'ai décidé d'être plus pernicieux et de convertir une table contenue dans une image au format Calc. Voyant qu'il pouvait gérer Calc, j'ai décidé d'être plus pernicieux et de convertir une table contenue dans une image au format Calc.
  
-Sera-t-il capable de lire le texte dans une image, de le rendre éditable et de le conserver dans un format de table décent ?+Sera-t-il capable de lire le texte dans une image, de le rendre modifiable et de le conserver dans un format de table décent ?
  
 La réponse est résolument oui ! Bien que du texte soit un peu détérioré, il faut dire que l'original était un PDF imprimé, scanné et retransformé à nouveau en PDF ; la qualité a quelque peu souffert. La réponse est résolument oui ! Bien que du texte soit un peu détérioré, il faut dire que l'original était un PDF imprimé, scanné et retransformé à nouveau en PDF ; la qualité a quelque peu souffert.
  
-Ce serait certainement facile de convertir cette sortie Calc en table qui ressemblerait à l'original.+Ce serait certainement facile de convertir cette sortie Calc en une table qui ressemblerait à l'original.
  
 Que devient l'image d'un texte après transformation en texte éditable ? Que devient l'image d'un texte après transformation en texte éditable ?
  
-Oui ! +Oui ! J'aime comment il le convertit en un texte éditable, réalisant un excellent travail en conservant même les en-têtes en gras. Ce n'est pas simplement un paquet en texte brut. Il essaie réellement de copier le format de l'original.
- +
-J'aime comment il le convertit en un texte éditable, réalisant un excellent travail en conservant même les entêtes en gras. Ce n'est pas simplement un paquet en texte brut. Il réellement essayé de copier le format de l'original.+
  
  
Ligne 112: Ligne 110:
 Conclusion Conclusion
  
-Bien sûrce n'est pas infaillible. Donnez-lui un fond coloré avec un texte blanc et je suis à peu près sûr qu'il est en défautmais comme la plupart des applications OCR. J'ai été particulièrement impressionné du peu d'erreurs trouvées dans la conversion d'une image de bonne qualité en texte éditable.+Bien entenduil n'est pas infaillible. Donnez-lui un fond coloré avec un texte blanc et je suis à peu près sûr qu'il échoueratout comme la plupart des applications OCR. J'ai été particulièrement impressionné du peu d'erreurs trouvées dans la conversion d'une image de bonne qualité en texte éditable.
  
-Si vous avez des images de haute qualité que vous voulez reconvertir en texte, alors cette application est réellement une de celles à étudier, et félicitations à Investintech d'avoir publié une version Linux de leur application.+Si vous avez des images de haute qualité que vous voulez reconvertir en texte, alors cette application est réellement une de celles à envisager. Félicitations à Investintech d'avoir publié une version Linux de leur application.
  
  
 Exigences pour un système Linux Exigences pour un système Linux
  
-OS: Linux Fedora 20 ou plus récent, Ubuntu 13.10 ou plus récent, en édition 32-bit+OS : Linux Fedora 20 ou plus récent, Ubuntu 13.10 ou plus récent, en édition 32-bit.
  
-RAM: 512 Mo ou + de mémoire disponible pour le logiciel+RAM : 512 Mo ou + de mémoire disponible pour le logiciel.
  
-Espace sur le disque dur : 250 Mo d'espace disque pour les composants du programme+Espace sur le disque dur : 250 Mo d'espace disque pour les composants du programme.
  
-Affichage : Résolution d'écran 1366 (largeur) x 768 (hauteur)+Affichage : Résolution d'écran 1366 (largeur) x 768 (hauteur).
  
 Version d'essai à télécharger sur : http://www.investintech.com/prod_downloadsa2e_pro.htm Version d'essai à télécharger sur : http://www.investintech.com/prod_downloadsa2e_pro.htm
Ligne 140: Ligne 138:
 Deadline for entries is Sunday 19th April. Five winners will be drawn at random.** Deadline for entries is Sunday 19th April. Five winners will be drawn at random.**
  
-COMPÉTITION :+CONCOURS :
  
 Pour gagner l'une des cinq clés sans limitation de temps de Able2Extract Professional 9, tout ce que vous avez à faire est de répondre à la question suivante : Pour gagner l'une des cinq clés sans limitation de temps de Able2Extract Professional 9, tout ce que vous avez à faire est de répondre à la question suivante :
issue95/able2extract.1429282166.txt.gz · Dernière modification : 2015/04/17 16:49 de d52fr