Enregistrement d'articles de blog en format pdf

Je connais FireShot, une extension firefox, pour sauvegarder des pages entières d'images. Et j'aime ça. Une excellente idée, et une très bonne mise en œuvre.

Mais malheureusement, souvent sur ce genre de sites, vous avez des liens qui se perdent de cette façon. Je me demande donc s'il existe une façon d'enregistrer de la même façon, des messages sur le blog, des messages wiki, des messages StackOverflow :), en tant que fichiers PDF, de sorte que les liens sont également enregistrés?

Si l'objectif est de conserver tout le contenu et les liens, tout en affectant le formatage le moins possible … Je recommande Evernote .

Je sais que ce n'est pas une solution PDF … mais après 2 ans d'archivage de pages Web dans des fichiers PDF et des images et je l'ai frustré, j'ai décidé de convertir mon outil personnel de capture Web en Evernote.

Donnez-lui un coup de feu, vous pourriez l'aimer.

Il existe une extension firefox appelée PDF Download qui sauvera une page en PDF (ou vous l'enverra par courrier électronique).

  • Il a enregistré les liens pour cette page lorsque j'ai essayé.
  • Mais, vous devez vous rappeler que la page sera enregistrée en tant que source publique,
    L'outil est en ligne (pas lorsque vous êtes connecté).
  • Il existe une version payée de l'outil PDF Nitro (du même endroit)
    Cela va le sauver directement de votre bureau et vous devriez également obtenir ces pièces manquantes.
    Je n'ai pas essayé cela cependant.
  • Un autre problème est,
    L'addon firefox gratuit (au moins) ne gère pas correctement les limites de la page PDF,
    Vous pouvez perdre une ligne de texte là-bas …
  • L'outil Nitro dispose d'un essai gratuit de 14 jours si vous souhaitez essayer cela

HTML-to-PDF est un outil Windows gratuit pour la conversion de lots de pages Web en document PDF. Il prend en charge les liens cliquables, les pages contenant JavaScript, les formes en direct et l'incorporation de polices.

Voir: http://sourceforge.net/projects/html-to-pdf/

Je sais que vous êtes probablement à la recherche d'une solution intelligente en une seule solution, auquel cas quelqu'un d'autre peut avoir une meilleure réponse.

Personnellement, je trouve que l'utilisation de Bullzip PDF Printer fonctionne très bien. Il a fondamentalement la capacité d'agir en tant qu'imprimante et tout ce qui irait au papier.

Beaucoup de pages ont des CSS alternatifs pour l'impression et se présentent assez bien. Pour les autres, je prends une capture d'écran, utilise la peinture et l'impression (pas élégante, mais ça marche!)

J'ai pensé à l'impression PDF, mais cela ne fonctionne pas bien, les liens sont perdus.

Dans ce cas, je copie / colle tout le site Web dans un traitement de texte et enregistre le document, ce qui fonctionne bien pour les liens, mais pas pour la mise en page de la page d'origine.

Avez-vous essayé le complément LOOP ? Il est censé convertir les URL (et les documents) en PDF.

Regardez zinepal . Il est plus adapté aux abonnements rss mais peut accepter tout contenu du Web.

Le site Web2pdf a l' air de le faire (il l'a fait pour moi pour cette page au moins) – pas libre mais mais cela n'a pas été spécifié dans la question 🙂

Vous voudrez peut-être jeter un oeil à wkhtmltopdf . C'est un convertisseur HTML to PDF basé sur le moteur HTML Webkit qui sous-tend Safari et la plupart des autres applications OS X qui affichent HTML, ainsi que le navigateur Google Chrome parmi d'autres applications. Il est conçu pour être un utilitaire basé sur la ligne de commande, et devrait être assez facile à modifier et à recompiler étant donné la capacité de créer des applications basées sur le cadre Qt.

Je ne me souviens pas exactement de ce qu'il fait avec les liens dans la page, mais il fait un travail décent de convertir le texte, y compris le formatage CSS vers un très beau document PDF.

Et c'est gratuit …

Modifier: En outre, une copie complète d'Acrobat a eu cette capacité depuis au moins Acrobat 3 ou 4 (c'est-à-dire longtemps). Cependant, vous devez acheter Acrobat complet, car Reader n'a pas la fonctionnalité. Il prend en charge deux modes de conversion: automatique et ad hoc. Le mode automatique parcourt l'URL fournie et récupère tout ce qu'il peut atteindre à partir de là. Puisque cela pourrait facilement impliquer la récupération de l'ensemble du Web, il a un contrôle sur le nombre de sauts qu'il est permis de s'éloigner de la page d'origine. Le mode ad hoc vous permet de naviguer d'une page à l'autre et, en cliquant sur les liens, il récupère la page, l'ajoute au document PDF croissant et réécrit les liens pour se référer au fichier PDF au lieu du Web.

La création PDF d'Acrobat est généralement le meilleur de l'émission, à l'exception de ce cas. Il ne gère pas vraiment suffisamment de spécifications CSS pour que les choses fonctionnent correctement. J'ai souvent eu les meilleurs résultats en définissant la mise en page sur le paysage, mais même alors, il est clunky.

Edit 2: J'ai supprimé Opera depuis la liste des utilisateurs de Webkit et j'ai ajouté un lien vers la page du projet Webkit. Merci à Dan Walker pour la correction.

Si le but de l'enregistrement en format PDF est d'avoir un accès hors ligne et de conserver le même format que vous le voyez sur le Web, je vous suggère d'essayer l' extension Scrapbook de Firefox. Il présente les caractéristiques suivantes:

  • Sauvegarder la page Web
  • Enregistrer l'extrait de la page Web
  • Sauvegarder le site Web (Capture approfondie)
  • Organisez la collection de la même manière que les signets
  • Highlighter, Eraser et différentes fonctionnalités d'édition de page
  • Recherche de texte intégral et recherche de filtrage rapide
  • Fonction d'édition de texte ressemblant aux notes d'Opera

Essayez-le . Il y a des milles au-dessus de tout.

Tous les principaux navigateurs à ma connaissance vous permettront d'enregistrer une page "Complète" si vous utilisez la commande de sauvegarde intégrée. Cela enregistre un fichier HTML ainsi qu'un seul dossier contenant toutes les images, etc.

Évidemment, ce n'est pas une solution PDF, mais elle préserve les liens et la mise en page.

Le convertisseur Web en PDF en ligne peut faire le tour http://www.web2pdfconvert.com

Pour répondre à votre question tangentielle. Alors que PDF peut gérer les liens, sauvegarde la page car html est plus proche de l'original et moins de dégradation. La plupart des navigateurs incluent une balise de base qui est bonne pour citer des sources (et nécessairement si elles utilisaient des URL incomplètes).

<base href="..." /> 

Si je me suis déjà éloigné de PDF … Si vous utilisez le navigateur Opera, vous pouvez voir la source, éliminer le préfixe de débris et suffiner le contenu souhaité. Et appliquez les modifications localement à l'aperçu avant d'enregistrer. Sans les débris, j'ai moins de faux positifs lors de la recherche. (Firefox devrait avoir quelque chose dans la boîte à outils similaire).

Ils disent que ce qui se passe sur Internet est là pour toujours … Essayez de visiter un site il y a une décennie …

Essayez Green Print , qui a la possibilité d'enlever les publicités et de rendre l'impression PDF très claire.