Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente |
issue130:critique [2018/02/26 11:26] – auntiee | issue130:critique [2018/02/27 14:27] (Version actuelle) – andre_domenech |
---|
/opt/investintech/a2ep/bin/Able2ExtractPro** | /opt/investintech/a2ep/bin/Able2ExtractPro** |
| |
On m'a récemment donné une clé de produit pour Able2Extract 12, un convertisseur et éditeur de PDF. Auparavant j'avais toujours fait ce genre de tâche avec divers outils en ligne de commande. Puisque l'extraction de textes des PDF, ou leur édition d'une quelconque façon, est quelque chose que je ne fais pas souvent, je ne peut pas promettre d'avoir testé tout ce que le logiciel propose. Cela étant dit, voici mes expériences et mes réflexions. | On m'a récemment donné une clé de produit pour Able2Extract 12, un convertisseur et éditeur de PDF. Auparavant j'avais toujours fait ce genre de tâche avec divers outils en ligne de commande. Puisque l'extraction de textes des PDF, ou leur édition d'une quelconque façon, est quelque chose que je ne fais pas souvent, je ne peux pas promettre d'avoir testé tout ce que le logiciel propose. Cela étant dit, voici mes expériences et mes réflexions. |
| |
Compatibilité | Compatibilité |
Bien que le logiciel ne propose des paquets que pour Ubuntu et Fedora, j'ai réussi à créer un PKGBUILD qui a installé et lance correctement le fichier .deb Ubuntu sous ArchLinux. | Bien que le logiciel ne propose des paquets que pour Ubuntu et Fedora, j'ai réussi à créer un PKGBUILD qui a installé et lance correctement le fichier .deb Ubuntu sous ArchLinux. |
| |
J'ai néanmoins rencontré un problème dans Ubuntu 16.04, Ubuntu 17.10 et ArchLinux. Plus précisément, l'application se plantait avec une erreur concernant l'emplacement des QT Fonts (polices QT). Après avoir contacté la société, on a pu solutionner le problème. Apparemment, l'application nécessite que le réglage de la variable $QT_QPA_FONTDIR soit fait au chemin root. Au lieu de définir ceci sur tout le système dans /etc/environment ou dans le.bashrc de mon utilisateur, j'ai créé un script bash que règle la variable et lance Able2Extract. Voici le script : | J'ai néanmoins rencontré un problème dans Ubuntu 16.04, Ubuntu 17.10 et ArchLinux. Plus précisément, l'application se plantait avec une erreur concernant l'emplacement des QT Fonts (polices QT). Après avoir contacté la société, on a pu résoudre le problème. Apparemment, l'application nécessite que le réglage de la variable $QT_QPA_FONTDIR soit paramétré vers chemin root. Au lieu de définir ceci sur tout le système dans /etc/environment ou dans le .bashrc de mon utilisateur, j'ai créé un script bash qui règle la variable et lance Able2Extract. Voici le script : |
| |
#!/bin/bash | #!/bin/bash |
The layout of the application itself is very familiar (after having used software such as Adobe Acrobat), and it offers some helpful (non-intrusive) tips when starting it for the first time.** | The layout of the application itself is very familiar (after having used software such as Adobe Acrobat), and it offers some helpful (non-intrusive) tips when starting it for the first time.** |
| |
J'ai choisi cette voie parce que le paquet Able2Extract, ne semble pas ajouter bin à votre variable $PATH, ce qui signifie qu'il ne peut être lancé, soit du dossier, soit du fichier .desktop. Après avoir déplacer le script dans un dossier sur mon PATH, je pouvais le lancer normalement. L'avantage supplémentaire est que cela n'interfère pas avec d'autres applications dans le cas où elle voudrait la même variable. | J'ai choisi cette voie parce que le paquet Able2Extract ne semble pas ajouter bin à votre variable $PATH, ce qui signifie qu'il ne peut être lancé que du dossier ou par le fichier .desktop. Après avoir déplacé le script dans un dossier sur mon PATH, je pouvais le lancer normalement. L'avantage supplémentaire est que cela n'interfère pas avec d'autres applications dans le cas où elles voudraient la même variable. |
| |
Interface de l'application | Interface de l'application |
| |
La disposition de l'application elle-même est très familière (après avoir utiliser un logiciel tel qu'Adobe Acrobat) et elle propose quelques conseils utiles (et discrets) quand vous le démarrez la première fois. | La disposition de l'application elle-même est très familière (après avoir utilisé un logiciel tel qu'Adobe Acrobat) et elle propose quelques conseils utiles (et discrets) quand vous la démarrez la première fois. |
| |
**Features | **Features |
Fonctionnalités | Fonctionnalités |
| |
L'application vous donne la possibilité de créer, éditer et convertir des fichiers PDF. Une partie du processus de conversion utilise la technologie de reconnaisse de caractères pour pouvoir convertir des PDF et fichiers prêts à l'édition, notamment des documents (.odt) ou des diapositives de présentations. En l'utilisant, vous pouvez également créer des feuilles de calcul, CSV, HTML, images et fichiers AutoCAD. | L'application vous donne la possibilité de créer, éditer et convertir des fichiers PDF. Une partie du processus de conversion utilise la technologie de reconnaissance de caractères pour pouvoir convertir des PDF et fichiers prêts à l'édition, notamment des documents (.odt) ou des diapositives de présentation. En l'utilisant, vous pouvez également créer des feuilles de calcul, CSV, HTML, images et fichiers AutoCAD. |
| |
J'ai testé les modes Word, Excel et HTML sur quelques scans de recettes de cuisine. Certains de ces fichiers avaient été créés avec la caméra d'un smartphone ; d'autres furent scannés sur un véritable scanner à plat. Le système de reconnaissance de caractères a bien fonctionné sur la plupart des fichiers que j'ai essayés, bien qu'une image, de très mauvaise qualité, avait quelques lacunes où des reflets de lumière ont obscurci le texte.Cela étant dit, j'aurais pu combler ces espaces de façon logique ou ajuster le contraste de l'image pour le rendre plus lisible. Les résultats HTML m'ont impressionné le plus, car le logiciel a en fait ajouté au texte pas mal d'éléments de style, pour le rendre propre et lisible. Si vous envisagez de transformer des PDF en fichiers HTML sans style pour les ajouter à un site Web, vous devrez prévoir comment enlever les styles en ligne. Je n'ai vu aucune option pour le convertisseur HTML. | J'ai testé les modes Word, Excel et HTML sur quelques scans de recettes de cuisine. Certains de ces fichiers avaient été créés avec la caméra d'un smartphone ; d'autres furent scannés sur un véritable scanner à plat. Le système de reconnaissance de caractères a bien fonctionné sur la plupart des fichiers que j'ai essayés, bien qu'une image, de très mauvaise qualité, ait eu quelques lacunes ou des reflets de lumière ont obscurci le texte. Cela étant dit, j'aurais pu combler ces espaces de façon logique ou ajuster le contraste de l'image pour la rendre plus lisible. Les résultats sur HTML m'ont le plus impressionné, car le logiciel a en fait ajouté au texte pas mal d'éléments de style, pour le rendre propre et lisible. Si vous envisagez de transformer des PDF en fichiers HTML sans style pour les ajouter à un site Web, vous devrez prévoir comment enlever les styles en ligne. Je n'ai vu aucune option pour le convertisseur HTML. |
| |
**The conversion options offered do allow you to handle things such as missing or unrecognized glyphs, or to set the file format for Word and Powerpoint conversions (on my system, it defaulted to OpenOffice). You can also do some document styling such as margins. | **The conversion options offered do allow you to handle things such as missing or unrecognized glyphs, or to set the file format for Word and Powerpoint conversions (on my system, it defaulted to OpenOffice). You can also do some document styling such as margins. |
Les options de conversion proposées vous permettent de gérer des trucs tels que des glyphes manquants ou non reconnus, ou de régler le format de fichier pour des conversions Word et Powerpoint (sur mon système, il est revenu par défaut a OpenOffice). Vous pouvez également appliquer quelques styles à votre document, notamment des marges. | Les options de conversion proposées vous permettent de gérer des trucs tels que des glyphes manquants ou non reconnus, ou de régler le format de fichier pour des conversions Word et Powerpoint (sur mon système, il est revenu par défaut a OpenOffice). Vous pouvez également appliquer quelques styles à votre document, notamment des marges. |
| |
L'outil de création choisit un fichier image et le transforme en PDF - je n'ai pas vu d'option de sélectionner des documents texte ou Word (bien qu'il soit possible de créer des fichiers PDF avec une imprimante PDF ou quelque chose comme LaTeX). Les outils d'édition comprennent des chose comme l'ajout de tampons, de surlignage, du texte, des commentaires, etc. Ils comportent aussi des choses comme retrancher des sections des fichiers, supprimer des pages du PDF, extraire des pages précises et ajuster les styles du texte. L'ajustement de style du texte semble ne fonctionner que sur certains PDF - lors de mes testes, ces options étaient grisées. Elles ne fonctionnent sans dout que sur des PDF créés à partir d'un document texte par rapport aux scans d'images. | L'outil de création choisit un fichier image et le transforme en PDF - je n'ai pas vu d'option pour sélectionner des documents texte ou Word (bien qu'il soit possible de créer des fichiers PDF avec une imprimante PDF ou quelque chose comme LaTeX). Les outils d'édition comprennent des choses comme l'ajout de tampons, de surlignage, du texte, des commentaires, etc. Ils comportent aussi des choses comme retrancher des sections de fichiers, supprimer des pages du PDF, extraire des pages précises et ajuster les styles du texte. L'ajustement de style du texte semble ne fonctionner que sur certains PDF - lors de mes tests, ces options étaient grisées. Elles ne fonctionnent sans doute que sur des PDF créés à partir d'un document texte au lieu de scans d'images. |
| |
**Results | **Results |
Comme noté dans la section précédente, presque toutes mes tentatives donnaient une copie entière du PDF. Dans certains cas (peu de contraste, peu de lumière, etc.) le fichier pouvait être troué ici ou là. C'était relativement facile de corriger ou de remplir les trous (surtout si vous pouviez accéder au document original). Le pire résultat venait d'une recette en trois colonnes : alors que le système de reconnaissance de caractères a réussi à séparer les colonnes comme il fallait (j'en ai vu certains qui traitent 3 colonnes comme une seule ligne), la reconnaissance des caractères du texte lui-même n'était pas très impressionnante. La police du fichier PDF était très petite et très légère, presque illisible, ce qui aurait pu ajouter au manque d'exactitude. Le fichier résultant aurait vraiment eu besoin d'une bonne relecture et de quelques corrections (en fait, la plupart des fichiers de reconnaissance de caractères doivent être vérifiés avant de pouvoir dire qu'ils sont terminés). | Comme noté dans la section précédente, presque toutes mes tentatives donnaient une copie entière du PDF. Dans certains cas (peu de contraste, peu de lumière, etc.) le fichier pouvait être troué ici ou là. C'était relativement facile de corriger ou de remplir les trous (surtout si vous pouviez accéder au document original). Le pire résultat venait d'une recette en trois colonnes : alors que le système de reconnaissance de caractères a réussi à séparer les colonnes comme il fallait (j'en ai vu certains qui traitent 3 colonnes comme une seule ligne), la reconnaissance des caractères du texte lui-même n'était pas très impressionnante. La police du fichier PDF était très petite et très légère, presque illisible, ce qui aurait pu ajouter au manque d'exactitude. Le fichier résultant aurait vraiment eu besoin d'une bonne relecture et de quelques corrections (en fait, la plupart des fichiers de reconnaissance de caractères doivent être vérifiés avant de pouvoir dire qu'ils sont terminés). |
| |
Globalement, les résultats que j'ai constatés avec Able2Extract 12 font concurrence à tous les autres logiciels de reconnaissance de caractères dont je me suis déjà servi ; par ailleurs, c'est bien meilleur que d'autres alternatives basées sur Linux que j'ai essayées jusqu'à présent. Est-il toujours parfait ? Non, mais lors de chaque test, il a rendu un fichier qui aurait réduit l'effort nécessaire pour le copier à la main d'au moins 50 à 60 %. Dans la plupart des cas, seules quelques petites corrections aurait étaient nécessaires. | Globalement, les résultats que j'ai constatés avec Able2Extract 12 font concurrence à tous les autres logiciels de reconnaissance de caractères dont je me suis déjà servi ; par ailleurs, c'est bien meilleur que d'autres alternatives basées sur Linux que j'ai essayées jusqu'à présent. Est-il toujours parfait ? Non, mais lors de chaque test, il a rendu un fichier qui aurait réduit d'au moins 50 à 60 % l'effort nécessaire pour le copier à la main. Dans la plupart des cas, seules quelques petites corrections auraient été nécessaires. |
| |
**Conclusion | **Conclusion |
Conclusion | Conclusion |
| |
Si vous travaillez beaucoup avec des PDF (segmenter des documents, faire de la reconnaissance de caractères, etc.) et n'avez pas une application Linux ad hoc, je recommanderais vivement d'essayer Able2Extract. Même si vous avez l'habitude d'utiliser une application, il se peut que les résultats de reconnaissance des caractères ne vous conviennent pas ; dans ce cas, à nouveau, je recommanderais l'essai d'Able2Extract. | Si vous travaillez beaucoup avec des PDF (segmenter des documents, faire de la reconnaissance de caractères, etc.) et n'avez pas d'application Linux ad hoc, je recommanderais vivement d'essayer Able2Extract. Même si vous avez l'habitude d'utiliser une application, il se peut que les résultats de reconnaissance des caractères ne vous conviennent pas ; dans ce cas, à nouveau, je recommanderais l'essai d'Able2Extract. |
| |
La note que je lui attribue est presque parfaite : si le paquet fonctionnait dès l'installation et s'il y avait des options supplémentaires pour les conversions HTML, je serais ravi de lui accorder un 5/5. | La note que je lui attribue est presque parfaite : si le paquet fonctionnait dès l'installation et s'il y avait des options supplémentaires pour les conversions HTML, je serais ravi de lui accorder un 5/5. |
| |