Fusionner des documents PDF

jPDFTweak fusionner des documents PDF

Lors d’un précédent article je vous avais présenté comment transformer des documents PDF en livret avec le logiciel jPDFTweak. Un lecteur m’ayant posé la question de comment fusionner des documents PDF, voici la réponse avec ce même logiciel. Je passe sur l’installation de jPDFTweak, vous l’avez dans le précédent article.

Je vais fusionner quatre documents dont :

  • une brochure au format A4 portrait ;
  • une affiche au format A4 portrait ;
  • un dépliant au format A3 paysage ;
  • une brochure au format carré 21 cm.

Le résultat sera un document unique au format A4 et contenant les quatre précités.

Importer les documents PDF

Lancez donc jPDFTweak. L’import de documents se fait sur l’onglet Input, à priori celui sur lequel s’ouvre le logiciel (une bonne idée non ?).

jpdftweak multi-import Fusionner des documents PDF

Mais il y a un obstacle à passer (est-il vraiment utile ? j’en doute) avant de choisir vos documents. Vous devez d’abord cocher la case Multiple file input (1). Ensuite vous pouvez y aller : (2) pour sélectionner les documents, puis en (3) pensez à la touche Ctrl pour sélectionner plusieurs documents d’un coup. Puis (4) Ouvrir et attendre patiemment que jPDFTweak ait lu tous vos documents.

Vous pouvez ensuite changer l’ordre des documents grâce aux boutons Up et Down en bas.

Questions de taille

L’onglet Page size nous permet de régler les différences de taille de page (si vous ne souhaitez pas égaliser toutes les pages au même format, il suffit de passer cette étape).

jpdftweak page-size Fusionner des documents PDFLa fonction Crop n’a pas l’air de servir à grand chose.

Il peut être intéressant de basculer les pages initialement en paysage (ici le document en A3) en portrait. Il faut alors cocher Rotate pages (1) et choisir une orientation pour les Landscape pages (2).

Enfin, on peut redimensionner toutes les pages au format A4 en cochant Scale pages (3) et en choisissant le format A4 portrait.

Adapter les informations du document

L’onglet Document info permet de changer les métadonnées du futur document.

jpdftweak document-info Fusionner des documents PDFCommencez par cocher Change Document info (1). Là encore, je ne vois pas l’intérêt de cette case à cocher…

Puis chargez les informations existantes (2) via le bouton Load from document. En fait, il charge les informations de l’un des documents.

À vous de les adapter à votre sauce (3).

Produire le document final

Enfin, passez sur l’onglet Output.

jpdftweak output multidocument Fusionner des documents PDFIl vous suffit de choisir le nom et l’emplacement du futur document (1) et d’envoyer la compilation via le bouton Run (2).

Imprimer des documents PDF en cahier ou livret

jpdftweak pour créer des cahiers PDF

Vous voulez imprimer un document au format PDF mais il comporte un grand nombre de pages et vous ne voulez pas y passer votre ramette de papier. Plusieurs solutions s’offent à vous. Vous pouvez évidemment imprimer en recto-verso (si votre imprimante ne le permet pas, vous devrez imprimer d’abord les pages impaires, puis les pages paires en ayant repéré le trajet de la feuille dans l’imprimante pour faire en sorte que ça colle bien). Vous pouvez aussi effectuer une réduction, c’est-à-dire, imprimer deux pages sur une seule : chaque page au format A4 est alors réduite en A5.

Mais le mieux est de réordonner les pages pour imprimer un cahier de sorte à ce que, une fois toutes les feuilles imprimées, vous puissiez les plier et les agrafer ensemble par le centre (piqure à cheval sur le pli). Pour cela il faut imprimer au recto, la dernière page à gauche, la première page à droite, puis au verso, la deuxième page à gauche et l’avant-dernière à droite, et ainsi de suite pour les autres pages. (suite…)

Extraire le contenu d’un document PDF

Si le document PDF a été bien conçu (le texte est bien du texte et non vectoriel ou pire, une image), alors il peut éventuellement être récupéré dans un fichier texte avec pdftotext.

  pdftotext document.pdf

Cette commande produit un fichier nommé document.txt.

Vous pouvez également extraire toutes les images avec pdfimages.

  pdfimages document.pdf prefixe

Cette commande va produire autant de fichier préfixés par prefixe au format PPM, un format très basique destiné à faciliter l’inter-opérabilité.

Convertir des images en PDF

Il existe évidemment nombre de logiciels avec interface graphique qui permettent de convertir une image en PDF, voire de composer un document rempli d’images. GIMP, Scribus, LibreOffice pour ne citer qu’eux.

Mais la puissance de la ligne de commande permet d’automatiser certaines choses (cependant, rien d’esthétique et mis en page avec goût) comme, créer un document PDF à partir d’une série d’images, à raison d’une image par page.
ImageMagick permet cela :

  convert *.jpg collection.pdf

Attention à la résolution des images ! La valeur par défaut est souvent 72 ou 96 dpi (point par pouce). Sachez que pour de l’impression, il faut minimum 150 dpi, ou mieux, 300.

Organiser un document PDF multipages

Vous voulez extraire certaines pages d’un document, assembler plusieurs documents en un seul, organiser les pages en quatre pages par feuilles (pour faire des économies à l’impression), etc. Il existe une batterie d’outils pour effectuer ce genre de manipulations.

Pdfjam

Pdfjam est un outil en ligne de commande. Il propose de nombreuses options mais aussi des commandes appelant des options préconfigurées.

  • pdfnup réarrange le document en réduisant les dimensions des pages et en assemblant plusieurs sur une même feuille.
    Par défaut, sans paramètre, pdfnup assemble deux pages sur une feuille (disposition 2×1).

    • Le paramètre --nup permet de spécifier la disposition.
      Par exemple --nup 2x2 place quatre pages dans la feuille.
    • Le paramètre --landscape vaut true ou false selon que l’on veut un résultat en paysage ou en portrait.
  • pdfbook modifie l’ordre des pages en vue d’une impression en cahier pour agrafage central.
    • Le paramètre --signature précise la signature, c’est-à-dire, la taille des cahiers, qui doit être un multiple de 4.
      Par défaut, la signature vaut 4, donc les pages sont réarrangées par groupes de 4 dans l’ordre suivant : 4 1 2 3.
      Ainsi, en raisonnant en recto-verso, la page 4 est imprimée derrière la page 1 et la page 3 derrière la 2.
      Une fois ceci effectué, si vous utilisez pdfnup vous obtenez deux nouvelles pages en paysage (si l’original est en portrait).
      La première est composée, dans l’ordre des pages 4 et 1, la deuxième des pages 2 et 3.
      Si vous imprimez ceci en recto-verso, les pages 4 et 1 sont bien dos-à-dos, ainsi que 2 et 3.En optant pour une signature de 8, la réorganisation donne : 8 1 2 7 6 3 4 5.
      Après passage par pdfnup on obtient : [8 1] [2 7] [6 3] [4 5].
      Imprimez en recto-verso, pliez en faisant en sorte que les chiffres qui se suivent se touchent, et insérez la feuille [6 3] [4 5] dans la feuille [8 1] [2 7].
  • pdfjoin fusionne plusieurs documents PDF en un seul.
  • pdf90, pdf180 et pdf270 pivotent respectivement de 90, 180 et 270 degrés les pages d’un ou de plusieurs documents PDF.

PDFtk

PDFtk est présenté ainsi sur le site Web : « Si PDF est le papier électronique, alors pdftk en est à la fois la dégrafeuse, la perforeuse, la relieuse, le décodeur et la paire de lunettes à rayons X. Pdftk est un outil simple conçu pour l’utilisation au quotidien des documents PDF. »

Une sorte de couteau suisse du PDF en somme. L’auteur du logiciel a d’ailleurs écrit un livre publié chez O’Reilly intitulé PDF Hacks.

Avec ce programme, vous pouvez :

  • fusionner des documents PDF ;
  • produire plusieurs documents à partir d’un seul ;
  • chiffrer et déchiffrer (moyennant le mot de passe, bien entendu 😉 un document ;
  • modifier les propriétés (mots clefs, commentaires, …) et les permissions d’un document ;
  • manipuler les formulaires et les fichiers attachés ;
  • ajouter un filigrane ;
  • compresser et décompresser le code PDF (pour l’éditer à la main par exemple) ;
  • réparer un document endommagé (dans la mesure du possible).

Cet outil s’utilise en ligne de commande, mais une interface graphique, guipdftk (en anglais également), est toutefois disponible pour Linux et Windows.

La syntaxe générique est la suivante :

  pdftk <fichiers PDF> <operation> [ <sortie> ]

Quelques exemples :

  • éclater un document en autant de fichier que de page : pdftk document.pdf burst
  • fusionner plusieurs documents : pdftk doc1.pdf doc2.pdf annexes*.pdf cat output integrale.pdf
  • extraire les pages 3 à 6 et 10 d’un document : pdftk document.pdf cat 3-6 10 output extrait.pdf

Annoter un document PDF

Opération plus simple que la modification du contenu. Imaginez que votre document est imprimé sur une feuille de papier et que vous annotiez à la main avec un stylo (rouge pour assouvir vos pulsions correctrices), à l’ancienne ! Vous tirez des traits, ajoutez des commentaires, tracez des cercles, etc. Vous pouvez même utiliser un surligneur.

Xournal est un logiciel libre d’annotation de documents PDF. Il rajoute un calque par dessus l’existant et vous permet d’y dessiner ce que vous voulez. La tablette graphique peut être un plus si vous écrivez à la main.

Mais on peut saisir du texte au clavier, tracez des lignes droites, des formes géométriques qui seront reconnues (si elle sont bien tracées).

Attention toutefois, la production d’un PDF annoté avec Xournal n’inclut pas les fontes. Prenez garde à n’utiliser que des fontes courantes.

Modifier un document PDF vectoriel et texte

Deux logiciels libres peuvent modifier le contenu d’un document PDF : Inkscape et OpenOffice.org Draw. Dans les deux cas, vous ouvrez le document comme un document existant (Fichier → Ouvrir), pas besoin de passer par une importation.

Inkscape pose plusieurs questions avant l’ouverture du document. Tout d’abord, il vous demande quelle page vous voulez éditer. En effet, Inkscape est un logiciel de dessin vectoriel, où la gestion multipage n’est pas une nécessité.

Les plus importantes sont les deux dernières. Cocher « Remplace les polices du PDF par les polices installées dont le nom est le plus proche » vous assure d’afficher du texte, même si vous ne possédez pas la bonne fonte. En revanche, le rendu sera altéré. Ne pas cocher cette case permet l’utilisation de la fonte d’origine, si elle est incorporée (même partiellement) ou si vous l’avez.

L’option « Incorporer les images » est vivement conseillée, si votre document en comporte.
Attention, certains textes peuvent être sous forme d’image (voir le formulaire Cerfa qui est le résultat d’un scan du formulaire papier suivie d’une réorganisation par blocs).

Une fois la page ouverte dans Inkscape, il va falloir s’y retrouver dans le méandre des groupes d’objets qui peut varier fortement selon le logiciel ayant produit le PDF. Voyez refcard.fr.pdf comme exemple d’imbrication exagérée de groupes. Il va falloir dégrouper les blocs où se situent les éléments que vous voulez modifier.

L’éditeur XML (menu Édition → éditeur XML) vous sera d’un grand secours pour comprendre la structure de la page.

Pour la modification de texte, vous risquez d’être confronté à des comportements bizarres en supprimant ou ajoutant des caractères. Inkscape voit généralement chaque caractère avec un crénage manuel qui lui est propre. Sélectionnez tout le texte que vous voulez modifier et supprimez le crénage manuel (Texte → Retirer les crénages manuels).

Une fois vos modifications effectuées, vous pourrez enregistrer votre page au format PDF.