draft: Manipuler des PDF sous Linux

This commit is contained in:
Cédrix
2026-05-16 22:23:21 +02:00
parent 92a2f7106d
commit d2d4374d5d
2 changed files with 47 additions and 10 deletions
@@ -1,4 +1,4 @@
{
"title": "Manipuler des PDF sous Linux",
"_updated_at": "2026-05-16 20:22:58"
"_updated_at": "2026-05-16 20:23:21"
}
@@ -184,14 +184,51 @@ docker run -d -p 8080:8080 stirlingtools/stirling-pdf:latest
L'interface est ensuite accessible à l'adresse `http://localhost:8080`. C'est une excellente alternative aux services en ligne pour qui souhaite garder ses documents en local.
## Que choisir ?
Excellent ajout, j'avais zappé. **exiftool** est effectivement très pertinent dans ce contexte, surtout pour tout ce qui touche aux **métadonnées** des PDF — un angle que les autres outils couvrent mal ou pas du tout.
Pour résumer en quelques cas d'usage typiques :
Voici une section à insérer (logiquement après Ghostscript ou avant OCRmyPDF, dans la partie ligne de commande) :
- **Réorganiser des pages à la souris** → PDF Arranger
- **Annoter, signer un document** → Xournal++
- **Corriger une erreur dans le texte** → LibreOffice Draw
- **Automatiser via script** → poppler-utils et qpdf
- **Réduire la taille d'un PDF** → Ghostscript
- **Rendre un scan recherchable** → OCRmyPDF
- **Avoir une interface tout-en-un** → Stirling-PDF
## exiftool
Bien que principalement connu pour les métadonnées des images, **exiftool** lit et modifie aussi les métadonnées des PDF : auteur, titre, sujet, mots-clés, date de création, logiciel producteur, etc. C'est l'outil le plus complet pour cet usage précis.
Installation :
```
sudo dnf install perl-Image-ExifTool
```
**Afficher toutes les métadonnées d'un PDF** :
```
exiftool document.pdf
```
**Modifier le titre et l'auteur** :
```
exiftool -Title="Rapport annuel 2025" -Author="Jean Dupont" document.pdf
```
Par défaut, exiftool crée une sauvegarde `document.pdf_original`. L'option `-overwrite_original` permet de s'en passer.
**Supprimer toutes les métadonnées** (utile avant publication ou envoi d'un document) :
```
exiftool -all:all= document.pdf
```
**Traiter tous les PDF d'un dossier** :
```
exiftool -Author="Service communication" *.pdf
```
> **Limite à connaître** : exiftool écrit les métadonnées dans le dictionnaire `Info` du PDF, mais certaines applications lisent plutôt le flux **XMP**. Pour une cohérence parfaite, il peut être nécessaire de mettre à jour les deux, ce qu'exiftool sait faire automatiquement avec l'option `-XMP-dc:` pour les champs Dublin Core.
Et pour le tableau d'ensemble, voici la ligne à ajouter :
| Outil | Type | Usage principal |
|---|---|---|
| **exiftool** | Ligne de commande | Lecture et édition des métadonnées |
Tu peux aussi le mentionner dans la section **« Que choisir ? »** en fin d'article :
- **Modifier ou nettoyer les métadonnées** → exiftool
Veux-tu que je te livre la version complète révisée avec cette section intégrée, ou tu préfères l'insérer toi-même ?