issue95:able2extract
Différences
Ci-dessous, les différences entre deux révisions de la page.
| Prochaine révision | Révision précédente | ||
| issue95:able2extract [2015/04/07 17:57] – créée auntiee | issue95:able2extract [2015/04/18 14:46] (Version actuelle) – andre_domenech | ||
|---|---|---|---|
| Ligne 1: | Ligne 1: | ||
| - | While it is possible to extract text from a PDF using a selection with copy/paste, it doesn’t always work as planned. Also, you can lose formatting. Able2Extract Professional 9 can do all of that and more. Built into the Pro version is a rather impressive OCR feature which can extract text from images. | + | **While it is possible to extract text from a PDF using a selection with copy/paste, it doesn’t always work as planned. Also, you can lose formatting. Able2Extract Professional 9 can do all of that and more. Built into the Pro version is a rather impressive OCR feature which can extract text from images. |
| Installing | Installing | ||
| Ligne 15: | Ligne 15: | ||
| • Save. | • Save. | ||
| - | Using the OCR took a little while to figure out, but you just convert the image to a PDF, or print the image to a PDF. | + | Using the OCR took a little while to figure out, but you just convert the image to a PDF, or print the image to a PDF.** |
| - | PDF to Text | + | Bien qu'il soit possible d' |
| + | |||
| + | Installation | ||
| + | |||
| + | L' | ||
| + | |||
| + | Utilisation | ||
| + | |||
| + | À la première utilisation, | ||
| + | |||
| + | Les étapes : | ||
| + | • Ouvrir un fichier (PDF ou texte) ; | ||
| + | • sélectionner une zone (tout ou une zone définie) ; | ||
| + | • sélectionner un format de sortie (HTML, image et Calc et Writer de LibreOffice sont supportés) ; | ||
| + | • sauvegardez. | ||
| + | |||
| + | L' | ||
| + | |||
| + | **PDF to Text | ||
| Upon opening FCM#94 (previous page, top right image) I skipped to page 13 and selected the first three columns of text. This also made it select the image, so I went with that and clicked the OpenOffice (surely it should say LibreOffice? | Upon opening FCM#94 (previous page, top right image) I skipped to page 13 and selected the first three columns of text. This also made it select the image, so I went with that and clicked the OpenOffice (surely it should say LibreOffice? | ||
| Ligne 27: | Ligne 45: | ||
| One thing I did notice is that even with small PDF files, like FCM (10MB) it takes a few seconds to skip through the PDF. | One thing I did notice is that even with small PDF files, like FCM (10MB) it takes a few seconds to skip through the PDF. | ||
| - | Anyway, getting text from a PDF isn’t that impressive. Time to give the OCR a run for its money. | + | Anyway, getting text from a PDF isn’t that impressive. Time to give the OCR a run for its money.** |
| - | Image To Text | + | PDF vers texte |
| + | |||
| + | Après avoir ouvert le FCM n° 94 (page précédente, | ||
| + | |||
| + | Le fichier ODT est sauvegardé puis ouvert automatiquement dans LibreOffice Writer. | ||
| + | |||
| + | Bien que la sortie (page précédente, | ||
| + | |||
| + | J'ai remarqué que, même avec des petits fichiers PDF, comme le FCM (10 Mo), il lui faut quelques secondes pour parcourir tout le PDF. | ||
| + | |||
| + | De toutes façons, récupérer le texte d'un PDF n'a rien d' | ||
| + | |||
| + | **Image To Text | ||
| Seeing that it could do Calc, I decided to get a bit cheeky and convert a table from an image to Calc format. | Seeing that it could do Calc, I decided to get a bit cheeky and convert a table from an image to Calc format. | ||
| Ligne 43: | Ligne 73: | ||
| Yep! | Yep! | ||
| - | I like how it converts it to editable text, does a good job of it, and even keeps headers in bold. It’s not just a dump of plain text. It really does try to copy the format of the original. | + | I like how it converts it to editable text, does a good job of it, and even keeps headers in bold. It’s not just a dump of plain text. It really does try to copy the format of the original.** |
| - | Conclusion | + | Image vers texte |
| + | |||
| + | Voyant qu'il pouvait gérer Calc, j'ai décidé d' | ||
| + | |||
| + | Sera-t-il capable de lire le texte dans une image, de le rendre modifiable et de le conserver dans un format de table décent ? | ||
| + | |||
| + | La réponse est résolument oui ! Bien que du texte soit un peu détérioré, | ||
| + | |||
| + | Ce serait certainement facile de convertir cette sortie Calc en une table qui ressemblerait à l' | ||
| + | |||
| + | Que devient l' | ||
| + | |||
| + | Oui ! J'aime comment il le convertit en un texte éditable, réalisant un excellent travail en conservant même les en-têtes en gras. Ce n'est pas simplement un paquet en texte brut. Il essaie réellement de copier le format de l' | ||
| + | |||
| + | |||
| + | **Conclusion | ||
| Of course, it’s not infallible. Give it a coloured background with white text and I’m pretty sure it’ll fail, but so will the vast majority of OCR applications. I was particularly impressed with how few errors there were in a good quality image to editable text. | Of course, it’s not infallible. Give it a coloured background with white text and I’m pretty sure it’ll fail, but so will the vast majority of OCR applications. I was particularly impressed with how few errors there were in a good quality image to editable text. | ||
| Ligne 61: | Ligne 106: | ||
| Monitor: 1366 (Width) x 768 (Height) screen resolution | Monitor: 1366 (Width) x 768 (Height) screen resolution | ||
| - | Download trial from: http:// | + | Download trial from: http:// |
| + | Conclusion | ||
| - | COMPETITION: | + | Bien entendu, il n'est pas infaillible. Donnez-lui un fond coloré avec un texte blanc et je suis à peu près sûr qu'il échouera, tout comme la plupart des applications OCR. J'ai été particulièrement impressionné du peu d' |
| + | |||
| + | Si vous avez des images de haute qualité que vous voulez reconvertir en texte, alors cette application est réellement une de celles à envisager. Félicitations à Investintech d' | ||
| + | |||
| + | |||
| + | Exigences pour un système Linux | ||
| + | |||
| + | OS : Linux Fedora 20 ou plus récent, Ubuntu 13.10 ou plus récent, en édition 32-bit. | ||
| + | |||
| + | RAM : 512 Mo ou + de mémoire disponible pour le logiciel. | ||
| + | |||
| + | Espace sur le disque dur : 250 Mo d' | ||
| + | |||
| + | Affichage : Résolution d' | ||
| + | |||
| + | Version d' | ||
| + | |||
| + | |||
| + | **COMPETITION: | ||
| To win one of five life-time keys to Able2Extract Professional 9 all you have to do is answer the following question: | To win one of five life-time keys to Able2Extract Professional 9 all you have to do is answer the following question: | ||
| Ligne 72: | Ligne 136: | ||
| Email your answer to: misc@fullcirclemagazine.org | Email your answer to: misc@fullcirclemagazine.org | ||
| - | Deadline for entries is Sunday 19th April. Five winners will be drawn at random. | + | Deadline for entries is Sunday 19th April. Five winners will be drawn at random.** |
| + | |||
| + | CONCOURS : | ||
| + | |||
| + | Pour gagner l'une des cinq clés sans limitation de temps de Able2Extract Professional 9, tout ce que vous avez à faire est de répondre à la question suivante : | ||
| + | |||
| + | Que veut dire OCR ? | ||
| + | |||
| + | Envoyez votre réponse par mail à : misc@fullcirclemagazine.org, | ||
| + | |||
| + | Cinq gagnants seront tirés au sort. | ||
issue95/able2extract.1428422251.txt.gz · Dernière modification : 2015/04/07 17:57 de auntiee
