95 lines
3.0 KiB
Markdown
95 lines
3.0 KiB
Markdown
# Manipuler des PDF sous Linux
|
|
|
|
Fusionner, séparer, réorganiser ou extraire le contenu d'un PDF : sous Linux, plusieurs outils — graphiques ou en ligne de commande — couvrent ces besoins. Voici une sélection des plus utiles, avec leur installation sur Fedora et un aperçu de leur usage.
|
|
|
|
## Vue d'ensemble des outils
|
|
|
|
| Outil | Type | Usage principal |
|
|
|---|---|---|
|
|
| **pdfshuffler** | Graphique | Fusionner, séparer, réordonner des pages |
|
|
| **pdfmod** | Graphique | Modifier la structure d'un PDF |
|
|
| **poppler-utils** | Ligne de commande | Conversion, extraction, fusion, découpe |
|
|
| **pdftk** | Ligne de commande | Manipulation avancée (fusion, chiffrement, formulaires) |
|
|
| **PDF Chain** | Graphique | Interface graphique pour pdftk |
|
|
|
|
## pdfmod
|
|
|
|
Application graphique simple pour réorganiser, supprimer ou faire pivoter les pages d'un PDF.
|
|
|
|

|
|
|
|
Installation :
|
|
|
|
```
|
|
sudo dnf install pdfmod
|
|
```
|
|
|
|
L'installation tire quelques dépendances Mono/GTK# (`gtk-sharp2`, `gnome-sharp`, `poppler-sharp`, `hyena`, `nunit`), soit environ 8 Mo une fois installé.
|
|
|
|
## pdfshuffler
|
|
|
|
Outil graphique léger orienté glisser-déposer, idéal pour assembler ou réorganiser des pages issues de plusieurs fichiers.
|
|
|
|

|
|
|
|
Installation :
|
|
|
|
```
|
|
sudo dnf install pdfshuffler
|
|
```
|
|
|
|
Dépendances principales : `pyPdf` et `pypoppler`.
|
|
|
|
### Utilisation
|
|
|
|
L'interface affiche les pages sous forme de vignettes, qu'il suffit de faire glisser pour les réordonner, supprimer ou regrouper avant export.
|
|
|
|

|
|
|
|
## poppler-utils
|
|
|
|
`poppler-utils` est une collection d'outils en ligne de commande s'appuyant sur l'API **poppler** pour manipuler les fichiers PDF.
|
|
|
|

|
|
|
|
Installation :
|
|
|
|
```
|
|
sudo dnf install poppler-utils
|
|
```
|
|
|
|
### Les commandes fournies
|
|
|
|
- **pdfdetach** — extrait les documents embarqués d'un PDF
|
|
- **pdffonts** — liste les polices utilisées
|
|
- **pdfimages** — extrait les images à leur résolution native
|
|
- **pdfinfo** — affiche les métadonnées du document
|
|
- **pdfseparate** — extrait des pages individuelles
|
|
- **pdftocairo** — convertit des pages en formats vectoriels ou bitmap via cairo
|
|
- **pdftohtml** — convertit un PDF en HTML en conservant la mise en forme
|
|
- **pdftoppm** — convertit une page PDF en bitmap
|
|
- **pdftops** — convertit un PDF au format PostScript imprimable
|
|
- **pdftotext** — extrait tout le texte
|
|
- **pdfunite** — fusionne plusieurs PDF
|
|
|
|
### Exemples pratiques
|
|
|
|
Les deux commandes les plus utiles au quotidien sont `pdfseparate` (découpe) et `pdfunite` (fusion).
|
|
|
|
**Extraire toutes les pages d'un document** dans des fichiers séparés :
|
|
|
|
```
|
|
pdfseparate ColoringBook.pdf ColoringBook-page_%d.pdf
|
|
```
|
|
|
|
**Extraire une plage de pages** (ici les pages 3 à 9) :
|
|
|
|
```
|
|
pdfseparate -f 3 -l 9 ColoringBook.pdf ColoringBook-page_%d.pdf
|
|
```
|
|
|
|
**Fusionner plusieurs PDF** en un seul document (par exemple les pages 3 et 4 extraites précédemment) :
|
|
|
|
```
|
|
pdfunite ColoringBook-page_3.pdf ColoringBook-page_4.pdf NewColoringBook.pdf
|
|
``` |