Articles of ocr

Comment trouver automatiquement des fichiers PDF non consultables

Supposons que j'ai un répertoire plein de nombreux PDF. Dans la plupart d'entre eux, le texte est complètement accessible, comme je l'ai besoin. Mais quelques-uns d'entre eux ne sont que des balayages d'image, et ils doivent être OCR-ed. D'autre part, faites simplement un OCR de lot sur l'annuaire entier, y at-il un moyen d'identifier rapidement […]

Utilisation de l'OCR sur le texte arabe

Un ami a demandé de convertir un texte en arabe .pdf en Word. Google Docs ne semble pas être une option, mais le nouveau OCR a l' air prometteur car l'arabe figure dans la liste déroulante «Langue de reconnaissance». J'ai échoué pour que cela fonctionne au-delà de "Erreur! Le texte ne peut pas être reconnu". […]

Convertisseur d'image à texte

J'ai besoin d'un logiciel qui peut convertir du texte scanné en texte modifiable. Je préférerai le freeware?

Le PDF a un extra blanc dans tous les mots après avoir parcouru Ghostscript

Ce PDF a été produit par Abbyy Finereader 10: Http://ebooks.zeitr.org/from_abbyy.pdf Vous pouvez copier et coller la première phrase et obtenir ce résultat de texte (très bon): Der »Bund Deutscher Gymnastik-Schulleiter« wurde m 20. novembre 1955 anläßlich einer Zusammenkunft der Leiterinnen und Leiter der privaten deutschen Gymnastik-Ausbildungsstätten gegründet. Après un certain traitement avec Ghostscript 9.02 (Windows […]

OCR de lot pour de nombreux fichiers PDF (pas déjà OCR)?

J'utilise Google Desktop Search (je suis sur Vista) et tous mes fichiers PDF ne sont pas reconnus dans mon dossier d'archive. Il est normal que les " fichiers PDF contenant des images numérisées " ne soient pas indexés ( http://desktop.google.com/support/bin/answer.py?hl=fr&answer=90651 ) J'aimerais donc écouter beaucoup de mes fichiers PDF qui ne sont pas encore OCR. […]

Scan A4 doc> pdf> ocr> traduire en anglais?

J'ai essayé d'utiliser une combinaison de Mon scanner à domicile pour créer un «300 dpi», un «document», un «pdf» (options sur tout le Canon tout-en-un) ZoHoViewer pour créer un fichier RTF ou TXT Google docs pour traduire Je ne sais pas à quel point un produit ZoHoViewer est bon ou mauvais, mais ce qui suit: […]

Bon OCR gratuit avec GUI pour corriger les erreurs? (Pour Windows)

J'ai utilisé SimpleOCR , qui a une jolie GUI pour corriger les erreurs. Malheureusement, cela fait beaucoup d'erreurs! (Et souffre d'autres bugs et limitations) D'autre part, Tesseract est plus précis mais n'a aucune interface graphique. Ma question est: existe-t-il un programme OCR gratuit pour Windows qui dispose d'une interface graphique agréable et d' un faible […]

Solution OCR pratique pour convertir un grand livre en format numérique?

J'étais passé par la place de mes grands-parents ce week-end dernier. Ma grand-mère a retiré ce livre géant (~ 1400 pages) de son histoire familiale remontant à 1630 environ. Nerd géant que je suis, j'ai pensé qu'il serait judicieux d'avoir toutes les informations stockées dans une base de données et disponibles sur le Web. Je […]

Comment puis-je convertir des images numérisées en PDF vers un fichier PDF consultable?

J'ai un fichier PDF d'un livre scanné. Je recherche un logiciel gratuit qui effectuera une OCR, puis fournira une option pour l'enregistrer en PDF ou document à nouveau. Est-ce qu'il y a un?

Extraction de texte à partir d'un livre scanné .PDF

J'ai un livre numérisé au format PDF, mais la qualité est plutôt médiocre: (La langue est roumaine et c'est un livre de physiologie médicale, au cas où vous vous demandiez) Je veux extraire le texte du livre (1500 pages) mais garder les images telles qu'elles sont. Je ne pense vraiment pas avoir la chance de […]