Comment puis-je copier ce devis depuis PDF?

Duplication possible:
Le fichier PDF a été confiné lors du collage de copie

Je lis une copie en PDF du document de Jérôme H. Friedman intitulé "Data Mining and Statistics: What's the Connection?" En utilisant Google Chrome.

Il contient une citation amusante que je veux copier et coller sur mon blog.

J'ai utilisé la souris pour sélectionner le texte du devis et appuyez sur CTRL + C pour copier le texte. Le document ressemble à ceci:

Une citation soulignée du document de Jérôme.

Lorsque je colle le texte dans le Bloc-notes, le Déploiement de la pile ou ailleurs, le produit est un gibberish semblable à Wingdings:

➣✍❺❼⑤➭✸❸❊➁❥❸❊⑥ ▼ ❽❾❸✘➎✳❸❾②|➊➥❸❊❸❊⑥❦⑨|②③✇ ▲ ➆ ②❥⑤⑩⑨|②❥⑤⑩❽❾⑤⑩✇➄⑥ ▼ ⑨❏✇➄⑥ ▼ ❺➌❽❾❻➀➍ ♣ ➂⑦❶❼②❥❸❊➁❷⑨❥❽❾⑤❸❊⑥✗②❥⑤⑩⑨|②③⑨✘⑤⑥☎②❥➇⑦⑤⑩⑨ ➔❸❊➅⑩❺➌⑨❹❸❊❸❊➍P⑨①②❥❻ ➎✳❸❏②❥➇ ▼ ✇ ▲ ②➟➊❚➇⑦❸❊⑥✆✇ P⑨|②③✇ ▲ ②❥⑤⑩⑨|②❥⑤⑩❽❾⑤⑩✇➄⑥❦➇ ▼ ✇➀⑨↔✇➄⑥❦⑤⑩❺❼❸✶✇ ♣ ➇⑦❸❷❻➀➁↔⑨❹➇⑦❸❷➊❚➁❥⑤②❥❸✶⑨ ✇❨➂ ▼ ✇➄➂✳❸❊➁✶Þ⑦ ✇ ♣ ❽❾❻➀➍ ♣ ➂⑦❶❼②❥❸❊➁➟⑨❥❽❾⑤❸❊⑥✗②❥⑤⑩⑨|②↔⑨|②③✇➄➁❹②③⑨❚✇ ♣ ❽❾❻➀➍ ♣ ➂ ▼ ✇➄⑥☛➧➀➏

Le texte doit plutôt ressembler à ceci:

Une différence entre les statisticiens et les informaticiens dans ce domaine semble être que lorsqu'un statisticien a une idée, il écrit un article; Un informaticien commence une entreprise.

J'ai dû taper ce texte manuellement. Ceci est faisable pour une telle petite citation, mais comment copier effectivement ce que je vois?

Est-ce quelque chose d'inhabituel sur le PDF, le navigateur, le plugin ou une certaine combinaison des trois?

3 Solutions collect form web for “Comment puis-je copier ce devis depuis PDF?”

La manière la plus fiable de le faire est d'utiliser OCR.

Mais en tant que solution sale et rapide, vous pouvez utiliser Google Quick View à partir du résultat de la recherche pour votre lien, dans l'option d'utilisation de la vue rapide Affichage> HTML brut .

Il contient encore du texte brouillé et est tout à fait illisible, mais une grande quantité de texte est correcte et copie . La recherche fonctionne ici afin que vous puissiez l'utiliser pour localiser le texte cible et le copier sans texte brouillé.


Exemple détaillé ici:
Les résultats de recherche Google pour l'URL incluent le lien Aperçu rapide.


Ensuite, utilisez l'option Affichage optionnel HTML .


La vue rapide a des options pour afficher le document en tant que HTML.


Sur la version HTML de Google, vous pouvez rechercher et sélectionner le texte équivalent comme ceci:


Recherchez le verion HTML pour trouver et sélectionner le devis pertinent.


Le collage dans le Bloc-notes produit cette sortie:

Une différence entre les staticipants et les informaticiens dans ce domaine semble être que lorsqu'un statisticien a une idée, il écrit le papier; Un informaticien commence une entreprise.

Pas exactement comme indiqué, mais assez près pour que vous puissiez travailler avec lui.

Vous devrez jeter le texte corrompu qui est déjà associé au PDF avant de pouvoir le re-OCR. La façon la plus simple de le faire est de l'enregistrer en format TIFF, puis l'ouvrir avec Acrobat et re-OCR. Quand j'ai fait ça, cela a fonctionné pour moi.

On dirait un fichier PDF avec un encodage incorrect. Voir les fils suivants:

  • Copiez le texte d'un PDF à l'autre. Obtenez juste Symbols

  • Le fichier PDF a été confiné lors du collage de copie

  • Recherchez des fichiers PDF avec des encodages de caractères non standard

Essayez d'imprimer le PDF en utilisant CutePDF , puis voyez si le PDF résultant est mieux.

  • FOSS Script pour le déverrouillage du PDF pour l'impression
  • Quels paramètres à utiliser lors de la création de fichiers 7zip afin d'obtenir une compression maximale lors de la compression de fichiers PDF?
  • Extrayez plusieurs sections de pages à partir d'un pdf
  • Comment rechercher dans les PDF avec Windows Search?
  • Comment analyser si un fichier PDF est valide?
  • Comment puis-je convertir automatiquement tous les fichiers de code source dans un dossier (récursivement) vers un seul PDF avec une mise en surbrillance de syntaxe?
  • Comment diviser le fichier pdf dans Windows?
  • Convertir PDF 2 côtés par page à 1 côté par page
  • Compter BW / pages couleur en PDF
  • Téléchargement PDF uniquement
  • Conversion en lots de documents Word en PDF
  • Soyons le génie de l'ordinateur et du réseau.