3.0 KiB
Manipuler des PDF sous Linux
Fusionner, séparer, réorganiser ou extraire le contenu d'un PDF : sous Linux, plusieurs outils — graphiques ou en ligne de commande — couvrent ces besoins. Voici une sélection des plus utiles, avec leur installation sur Fedora et un aperçu de leur usage.
Vue d'ensemble des outils
| Outil | Type | Usage principal |
|---|---|---|
| pdfshuffler | Graphique | Fusionner, séparer, réordonner des pages |
| pdfmod | Graphique | Modifier la structure d'un PDF |
| poppler-utils | Ligne de commande | Conversion, extraction, fusion, découpe |
| pdftk | Ligne de commande | Manipulation avancée (fusion, chiffrement, formulaires) |
| PDF Chain | Graphique | Interface graphique pour pdftk |
pdfmod
Application graphique simple pour réorganiser, supprimer ou faire pivoter les pages d'un PDF.
Installation :
sudo dnf install pdfmod
L'installation tire quelques dépendances Mono/GTK# (gtk-sharp2, gnome-sharp, poppler-sharp, hyena, nunit), soit environ 8 Mo une fois installé.
pdfshuffler
Outil graphique léger orienté glisser-déposer, idéal pour assembler ou réorganiser des pages issues de plusieurs fichiers.
Installation :
sudo dnf install pdfshuffler
Dépendances principales : pyPdf et pypoppler.
Utilisation
L'interface affiche les pages sous forme de vignettes, qu'il suffit de faire glisser pour les réordonner, supprimer ou regrouper avant export.
poppler-utils
poppler-utils est une collection d'outils en ligne de commande s'appuyant sur l'API poppler pour manipuler les fichiers PDF.
Installation :
sudo dnf install poppler-utils
Les commandes fournies
- pdfdetach — extrait les documents embarqués d'un PDF
- pdffonts — liste les polices utilisées
- pdfimages — extrait les images à leur résolution native
- pdfinfo — affiche les métadonnées du document
- pdfseparate — extrait des pages individuelles
- pdftocairo — convertit des pages en formats vectoriels ou bitmap via cairo
- pdftohtml — convertit un PDF en HTML en conservant la mise en forme
- pdftoppm — convertit une page PDF en bitmap
- pdftops — convertit un PDF au format PostScript imprimable
- pdftotext — extrait tout le texte
- pdfunite — fusionne plusieurs PDF
Exemples pratiques
Les deux commandes les plus utiles au quotidien sont pdfseparate (découpe) et pdfunite (fusion).
Extraire toutes les pages d'un document dans des fichiers séparés :
pdfseparate ColoringBook.pdf ColoringBook-page_%d.pdf
Extraire une plage de pages (ici les pages 3 à 9) :
pdfseparate -f 3 -l 9 ColoringBook.pdf ColoringBook-page_%d.pdf
Fusionner plusieurs PDF en un seul document (par exemple les pages 3 et 4 extraites précédemment) :
pdfunite ColoringBook-page_3.pdf ColoringBook-page_4.pdf NewColoringBook.pdf



