issue95:able2extract
Différences
Ci-dessous, les différences entre deux révisions de la page.
Prochaine révision | Révision précédente | ||
issue95:able2extract [2015/04/07 17:57] – créée auntiee | issue95:able2extract [2015/04/18 14:46] (Version actuelle) – andre_domenech | ||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
- | While it is possible to extract text from a PDF using a selection with copy/paste, it doesn’t always work as planned. Also, you can lose formatting. Able2Extract Professional 9 can do all of that and more. Built into the Pro version is a rather impressive OCR feature which can extract text from images. | + | **While it is possible to extract text from a PDF using a selection with copy/paste, it doesn’t always work as planned. Also, you can lose formatting. Able2Extract Professional 9 can do all of that and more. Built into the Pro version is a rather impressive OCR feature which can extract text from images. |
Installing | Installing | ||
Ligne 15: | Ligne 15: | ||
• Save. | • Save. | ||
- | Using the OCR took a little while to figure out, but you just convert the image to a PDF, or print the image to a PDF. | + | Using the OCR took a little while to figure out, but you just convert the image to a PDF, or print the image to a PDF.** |
- | PDF to Text | + | Bien qu'il soit possible d' |
+ | |||
+ | Installation | ||
+ | |||
+ | L' | ||
+ | |||
+ | Utilisation | ||
+ | |||
+ | À la première utilisation, | ||
+ | |||
+ | Les étapes : | ||
+ | • Ouvrir un fichier (PDF ou texte) ; | ||
+ | • sélectionner une zone (tout ou une zone définie) ; | ||
+ | • sélectionner un format de sortie (HTML, image et Calc et Writer de LibreOffice sont supportés) ; | ||
+ | • sauvegardez. | ||
+ | |||
+ | L' | ||
+ | |||
+ | **PDF to Text | ||
Upon opening FCM#94 (previous page, top right image) I skipped to page 13 and selected the first three columns of text. This also made it select the image, so I went with that and clicked the OpenOffice (surely it should say LibreOffice? | Upon opening FCM#94 (previous page, top right image) I skipped to page 13 and selected the first three columns of text. This also made it select the image, so I went with that and clicked the OpenOffice (surely it should say LibreOffice? | ||
Ligne 27: | Ligne 45: | ||
One thing I did notice is that even with small PDF files, like FCM (10MB) it takes a few seconds to skip through the PDF. | One thing I did notice is that even with small PDF files, like FCM (10MB) it takes a few seconds to skip through the PDF. | ||
- | Anyway, getting text from a PDF isn’t that impressive. Time to give the OCR a run for its money. | + | Anyway, getting text from a PDF isn’t that impressive. Time to give the OCR a run for its money.** |
- | Image To Text | + | PDF vers texte |
+ | |||
+ | Après avoir ouvert le FCM n° 94 (page précédente, | ||
+ | |||
+ | Le fichier ODT est sauvegardé puis ouvert automatiquement dans LibreOffice Writer. | ||
+ | |||
+ | Bien que la sortie (page précédente, | ||
+ | |||
+ | J'ai remarqué que, même avec des petits fichiers PDF, comme le FCM (10 Mo), il lui faut quelques secondes pour parcourir tout le PDF. | ||
+ | |||
+ | De toutes façons, récupérer le texte d'un PDF n'a rien d' | ||
+ | |||
+ | **Image To Text | ||
Seeing that it could do Calc, I decided to get a bit cheeky and convert a table from an image to Calc format. | Seeing that it could do Calc, I decided to get a bit cheeky and convert a table from an image to Calc format. | ||
Ligne 43: | Ligne 73: | ||
Yep! | Yep! | ||
- | I like how it converts it to editable text, does a good job of it, and even keeps headers in bold. It’s not just a dump of plain text. It really does try to copy the format of the original. | + | I like how it converts it to editable text, does a good job of it, and even keeps headers in bold. It’s not just a dump of plain text. It really does try to copy the format of the original.** |
- | Conclusion | + | Image vers texte |
+ | |||
+ | Voyant qu'il pouvait gérer Calc, j'ai décidé d' | ||
+ | |||
+ | Sera-t-il capable de lire le texte dans une image, de le rendre modifiable et de le conserver dans un format de table décent ? | ||
+ | |||
+ | La réponse est résolument oui ! Bien que du texte soit un peu détérioré, | ||
+ | |||
+ | Ce serait certainement facile de convertir cette sortie Calc en une table qui ressemblerait à l' | ||
+ | |||
+ | Que devient l' | ||
+ | |||
+ | Oui ! J'aime comment il le convertit en un texte éditable, réalisant un excellent travail en conservant même les en-têtes en gras. Ce n'est pas simplement un paquet en texte brut. Il essaie réellement de copier le format de l' | ||
+ | |||
+ | |||
+ | **Conclusion | ||
Of course, it’s not infallible. Give it a coloured background with white text and I’m pretty sure it’ll fail, but so will the vast majority of OCR applications. I was particularly impressed with how few errors there were in a good quality image to editable text. | Of course, it’s not infallible. Give it a coloured background with white text and I’m pretty sure it’ll fail, but so will the vast majority of OCR applications. I was particularly impressed with how few errors there were in a good quality image to editable text. | ||
Ligne 61: | Ligne 106: | ||
Monitor: 1366 (Width) x 768 (Height) screen resolution | Monitor: 1366 (Width) x 768 (Height) screen resolution | ||
- | Download trial from: http:// | + | Download trial from: http:// |
+ | Conclusion | ||
- | COMPETITION: | + | Bien entendu, il n'est pas infaillible. Donnez-lui un fond coloré avec un texte blanc et je suis à peu près sûr qu'il échouera, tout comme la plupart des applications OCR. J'ai été particulièrement impressionné du peu d' |
+ | |||
+ | Si vous avez des images de haute qualité que vous voulez reconvertir en texte, alors cette application est réellement une de celles à envisager. Félicitations à Investintech d' | ||
+ | |||
+ | |||
+ | Exigences pour un système Linux | ||
+ | |||
+ | OS : Linux Fedora 20 ou plus récent, Ubuntu 13.10 ou plus récent, en édition 32-bit. | ||
+ | |||
+ | RAM : 512 Mo ou + de mémoire disponible pour le logiciel. | ||
+ | |||
+ | Espace sur le disque dur : 250 Mo d' | ||
+ | |||
+ | Affichage : Résolution d' | ||
+ | |||
+ | Version d' | ||
+ | |||
+ | |||
+ | **COMPETITION: | ||
To win one of five life-time keys to Able2Extract Professional 9 all you have to do is answer the following question: | To win one of five life-time keys to Able2Extract Professional 9 all you have to do is answer the following question: | ||
Ligne 72: | Ligne 136: | ||
Email your answer to: misc@fullcirclemagazine.org | Email your answer to: misc@fullcirclemagazine.org | ||
- | Deadline for entries is Sunday 19th April. Five winners will be drawn at random. | + | Deadline for entries is Sunday 19th April. Five winners will be drawn at random.** |
+ | |||
+ | CONCOURS : | ||
+ | |||
+ | Pour gagner l'une des cinq clés sans limitation de temps de Able2Extract Professional 9, tout ce que vous avez à faire est de répondre à la question suivante : | ||
+ | |||
+ | Que veut dire OCR ? | ||
+ | |||
+ | Envoyez votre réponse par mail à : misc@fullcirclemagazine.org, | ||
+ | |||
+ | Cinq gagnants seront tirés au sort. |
issue95/able2extract.1428422251.txt.gz · Dernière modification : 2015/04/07 17:57 de auntiee