Outils pour utilisateurs

Outils du site


issue106:critique1

I previously reviewed Able2Extract way back in FCM#95. Since then several new things have been added, so it’s time to give Able2Extract another whirl, this time version 10, and try out the new features. Conversion From Image The main thing that Able2Extract (A2E) does is convert image text to either a document, a spreadsheet, or a presentation. It does this by saving to either Microsoft Office, or LibreOffice formats. It says OpenOffice in the toolbar – but the formats are the same for LO and OoO. The first thing I tried was to take a PDF that was comprised of images and test the OCR functionality within A2E. While the conversion wasn’t perfect, I purposely chose this text because it was flawed. It was highly compressed, and not your usual serif style font. I wanted to see how A2E would cope with it. And it coped extremely well, considering… It even managed to recognise, and keep, the italic words, and where words were hyphenated at the end of a line.

J'ai déjà fait une critique de Able2Extract il y a un peu plus d'un an dans le FCM n° 95. Depuis, plusieurs nouveautés ont été ajoutées ; le moment est donc venu de regarder Able2Extract à nouveau - cette fois-ci la version 10 - et d'essayer ses nouvelles fonctionnalités.

Conversion à partir d'une image

La fonction principale d'Able2Extract est de convertir l'image de texte en document, en feuille de calcul ou en une présentation. Il le fait en enregistrant sous un format de Microsoft Office ou de LibreOffice. C'est OpenOffice qui paraît dans la barre d'outils, mais les formats sont les même pour LO et pour OoO.

La première chose que j'ai essayée était de prendre un PDF ne comportant que des images et de tester la fonctionnalité de OCR (reconnaissance des caractères) d'A2E.

La conversion n'était pas parfaite, mais j'avais choisi ce document parce qu'il contenait des erreurs. C'est très compressé et la police était inhabituelle. Je voulais voir ce que A2E arriverait à en faire. Et, tout compte fait, il s'est débrouillé très, très bien.

Il a même réussi à reconnaître et à garder des mots en italique et des mots avec césure en fin de ligne.

Text From A PDF In most cases you can copy/paste from a PDF. But with some PDF’s (unfortunately, FCM being one of them), you get less than perfect results. For this test, I converted a page from FCM to a PNG image. With the PDF opened I did a copy/paste of the first column of text. Next, I opened the PNG page image into A2E and selected only the first column to convert it to LibreOffice Write (ie: text). In the image, you can see, on the left, the PNG image of the column. In the middle you see the A2E conversion. And, on the right, you see the copy/paste from the PDF to LibreOffice. The clear winner is the A2E conversion. Again, not perfect, but certainly more usable than the copy/paste. I should also mention that the OCR conversion from image to text is extremely quick with very little waiting time.

Texte à partir d'un PDF

Dans la plupart des cas, il est possible de faire des copier/coller à partir d'un PDF. Mais, avec certains PDF (dont le FCM, malheureusement), les résultats ne sont pas tout à fait parfaits.

Pour ce texte, j'ai converti une page du FCM en image PNG. Le PDF étant ouvert, j'ai fait un copier/coller de la première colonne du texte.

J'ai ensuite ouvert l'image PNG de la page dans A2E et je n'ai sélectionné que la première colonne pour la convertir en format Writer, autrement dit, en texte. Dans l'image, vous voyez, à gauche, l'image PNG de la colonne ; au milieu, la conversion A2E ; et, à droite, vous voyez le copier/coller, PDF vers LibreOffice.

Le gagnant est clairement la conversion A2E. À nouveau, ce n'est pas parfait, mais nettement plus utilisable que le copier/coller.

Je me dois de mentionner aussi que la conversion OCR d'image en texte est très rapide, avec un minimum de temps d'attente.

Editing PDF Files A new feature of A2E is being able to edit PDF files. Either by adding/deleting pages, rearranging pages, but also by live editing the text. Here, I took a PDF that was just text, loaded it into A2E and tried editing the text. Worked like a charm! In the example image shown below, I have the original PDF loaded in A2E (top) and the edited PDF (bottom). As you can see the edited version has kept the same font, and the edit has nicely blended in the changes. Clicking the Edit button at the top of the window brings this new feature into play. It’s within the edit section; you can add/remove/move pages within a PDF.

L'édition de fichiers PDF

Une nouvelle fonctionnalité d'A2E est la possibilité d'éditer des fichiers PDF, soit en ajoutant/supprimant des pages ou en changeant l'ordre des pages, mais aussi en éditant le texte « en live ».

J'ai donc pris un PDF qui ne comportait que du texte, je l'ai chargé dans A2E et j'ai essayé d'éditer le texte. Comme une lettre à la poste (autrefois) !

Dans l'image exemple ci-dessous, le PDF d'origine est chargé en A2E (en haut) et le PDF édité se trouve en bas. Comme vous pouvez le voir, la version éditée a gardé la même police et les modifications sont prises en charge de façon quasi invisible.

En cliquant sur le bouton Edit (Édition) en haut de la fenêtre, vous activez cette nouvelle fonctionnalité. C'est à l'intérieur de la section edit que vous pouvez ajouter/supprimer/déplacer les pages dans un PDF.

OTHER FEATURES I won’t bore you with the details of the other features again. If you’d like to read about them then feel free to check FCM#95 for a full run-down of the other features. But, in short, A2E can do conversion to text by either a full page, full document, or a selected area. Like I mentioned earlier, it can convert to MS Office, LibreOffice, but it can also convert to HTML, AutoCAD, and various image file formats. CONS The only one minor downside I have to report is that a couple of the keyboard shortcuts didn’t work. Especially CTRL++ (to Zoom In). CTRL– does work fine, however. Live editing of PDFs within A2E is a bit slow, but it does work very well. It’s not 100% though, as it couldn’t edit text within any of the FCM PDF files. I’m not sure if that’s a flaw in A2E or in the PDFs exported by Scribus. CONCLUSION In short: if you have images/PDFs that need to be converted, then A2E is definitely something I’d recommend. Certainly quicker and probably more reliable than manually typing them in – if you require text. But, only if the images you have are high quality scans. Low quality scans will give errors in the resulting text, but that’s not really a flaw within A2E. OCR software has always required high resolution scans. Able2Extract: http://www.investintech.com/prod_featuresList_a2epro.htm

AUTRES FONCTIONNALITÉS

Je ne vais pas vous ennuyer en répétant les détails des autres fonctionnalités. Si vous voulez en lire un compte rendu, n'hésitez pas à regarder dans le FCM n° 95 où vous en trouverez une présentation détaillée.

En résumé, A2E peut faire la conversion vers du texte par page, par document en entier ou par partie sélectionnée. Comme je l'ai déjà dit, il peut convertir vers les formats de MS Office et LibreOffice, mais aussi vers HTML, AutoCAD et divers formats de fichiers d'image.

INCONVÉNIENTS

Le seul inconvénient mineur que je vois est que deux ou trois raccourcis clavier ne fonctionnent pas, surtout CTRL++ (pour zoomer en avant), en revanche CTRL– fonctionne très bien.

L'édition de PDF dans A2E est un peu lent, mais fonctionne très bien. Toutefois, pas à 100 %, car il ne pouvait modifier du texte à l'intérieur d'aucun des fichiers PDF du FCM. Je ne sais s'il s'agit d'un problème dans A2E ou dans les PDF exportés par Scribus.

CONCLUSION

Bref, si vous avez des images/PDF que vous devez convertir, A2E est quelque chose que je recommande sans réserve. C'est sans conteste plus rapide et, sans doute, plus fiable que de les retaper à la main, si vous avez besoin de texte. Mais c'est le cas seulement si les scans de vos images sont de haute qualité. Des scans de basse qualité donneront des erreurs dans le résultat, mais ce n'est pas un problème d'A2E. Les logiciels d'OCR ont toujours nécessité des scans en haute résolution.

Able2Extract : http://www.investintech.com/prod_featuresList_a2epro.htm

issue106/critique1.txt · Dernière modification : 2016/04/08 09:50 de andre_domenech