publish: Manipuler des PDF sous Linux
This commit is contained in:
@@ -1,17 +0,0 @@
|
||||
{
|
||||
"title": "Manipuler des PDF sous Linux",
|
||||
"_updated_at": "2026-05-16 20:25:20",
|
||||
"slug": "manipuler-les-pdf-sous-linux",
|
||||
"published": true,
|
||||
"published_at": "2023-02-28 20:02",
|
||||
"category": "Informatique",
|
||||
"tags": {
|
||||
"tags": [
|
||||
"PDF",
|
||||
"OCR",
|
||||
"PostScript"
|
||||
]
|
||||
},
|
||||
"seo_title": "",
|
||||
"seo_description": ""
|
||||
}
|
||||
@@ -1,220 +0,0 @@
|
||||
# Manipuler des PDF sous Linux
|
||||
|
||||
Fusionner, séparer, réorganiser, annoter ou compresser un PDF : sous Linux, plusieurs outils — graphiques ou en ligne de commande — couvrent ces besoins. Voici une sélection des plus utiles aujourd'hui, avec leur installation sur Fedora et un aperçu de leur usage.
|
||||
|
||||
## Vue d'ensemble des outils
|
||||
|
||||
| Outil | Type | Usage principal |
|
||||
|---|---|---|
|
||||
| **PDF Arranger** | Graphique | Fusionner, séparer, réordonner des pages |
|
||||
| **Xournal++** | Graphique | Annoter, surligner, signer |
|
||||
| **LibreOffice Draw** | Graphique | Éditer le contenu (texte, images) |
|
||||
| **Okular** | Graphique | Lecture avancée, annotations |
|
||||
| **poppler-utils** | Ligne de commande | Conversion, extraction, fusion, découpe |
|
||||
| **qpdf** | Ligne de commande | Manipulation structurelle, chiffrement, réparation |
|
||||
| **Ghostscript** | Ligne de commande | Compression, conversion PDF/A, fusion |
|
||||
| **OCRmyPDF** | Ligne de commande | Ajout d'une couche OCR aux PDF scannés |
|
||||
| **pdftk-java** | Ligne de commande | Fusion, chiffrement, formulaires |
|
||||
| **Stirling-PDF** | Web (auto-hébergé) | Suite complète d'opérations PDF |
|
||||
| **exiftool** | Ligne de commande | Lecture et édition des métadonnées |
|
||||
|
||||
## PDF Arranger
|
||||
|
||||
Outil graphique léger orienté glisser-déposer, idéal pour assembler ou réorganiser des pages issues de plusieurs fichiers. Successeur direct de pdfshuffler, dont il reprend l'interface, mais activement maintenu et basé sur **pikepdf**.
|
||||
|
||||
Installation :
|
||||
```
|
||||
sudo dnf install pdfarranger
|
||||
```
|
||||
|
||||
L'interface affiche les pages sous forme de vignettes, qu'il suffit de faire glisser pour les réordonner, supprimer, faire pivoter ou regrouper avant export. On peut ouvrir plusieurs PDF simultanément et déplacer les pages de l'un à l'autre.
|
||||
|
||||
> **Note** : les anciens outils **pdfshuffler** et **pdfmod** ne sont plus maintenus. pdfmod, basé sur Mono, est particulièrement à éviter aujourd'hui. PDF Arranger les remplace avantageusement.
|
||||
|
||||
## Xournal++
|
||||
|
||||
Pour annoter, surligner, dessiner à main levée ou apposer une signature sur un PDF, Xournal++ est l'outil de référence. Il sauvegarde au format `.xopp` mais exporte en PDF avec les annotations intégrées.
|
||||
|
||||
Installation :
|
||||
```
|
||||
sudo dnf install xournalpp
|
||||
```
|
||||
|
||||
## LibreOffice Draw
|
||||
|
||||
Souvent négligé, Draw ouvre directement les PDF et permet d'**éditer le texte et les objets** — fonctionnalité qu'aucun autre outil de cette liste ne propose en standard. Pratique pour corriger une faute de frappe ou modifier un visuel sans avoir le fichier source.
|
||||
|
||||
LibreOffice étant généralement déjà installé, aucune action supplémentaire n'est nécessaire dans la plupart des cas.
|
||||
|
||||
## poppler-utils
|
||||
|
||||
`poppler-utils` est une collection d'outils en ligne de commande s'appuyant sur l'API **poppler** pour manipuler les fichiers PDF.
|
||||
|
||||
Installation :
|
||||
```
|
||||
sudo dnf install poppler-utils
|
||||
```
|
||||
|
||||
### Les commandes fournies
|
||||
|
||||
- **pdfdetach** — extrait les documents embarqués d'un PDF
|
||||
- **pdffonts** — liste les polices utilisées
|
||||
- **pdfimages** — extrait les images à leur résolution native
|
||||
- **pdfinfo** — affiche les métadonnées du document
|
||||
- **pdfseparate** — extrait des pages individuelles
|
||||
- **pdftocairo** — convertit des pages en formats vectoriels ou bitmap via cairo
|
||||
- **pdftohtml** — convertit un PDF en HTML en conservant la mise en forme
|
||||
- **pdftoppm** — convertit une page PDF en bitmap
|
||||
- **pdftops** — convertit un PDF au format PostScript imprimable
|
||||
- **pdftotext** — extrait tout le texte
|
||||
- **pdfunite** — fusionne plusieurs PDF
|
||||
|
||||
### Exemples pratiques
|
||||
|
||||
**Extraire tout le texte d'un document** :
|
||||
```
|
||||
pdftotext document.pdf
|
||||
```
|
||||
|
||||
L'option `-layout` préserve la mise en page d'origine, ce qui est précieux pour les documents contenant des tableaux :
|
||||
```
|
||||
pdftotext -layout rapport.pdf
|
||||
```
|
||||
|
||||
**Extraire toutes les pages d'un document** dans des fichiers séparés :
|
||||
```
|
||||
pdfseparate ColoringBook.pdf ColoringBook-page_%d.pdf
|
||||
```
|
||||
|
||||
**Extraire une plage de pages** (ici les pages 3 à 9) :
|
||||
```
|
||||
pdfseparate -f 3 -l 9 ColoringBook.pdf ColoringBook-page_%d.pdf
|
||||
```
|
||||
|
||||
**Fusionner plusieurs PDF** en un seul document :
|
||||
```
|
||||
pdfunite ColoringBook-page_3.pdf ColoringBook-page_4.pdf NewColoringBook.pdf
|
||||
```
|
||||
|
||||
**Convertir une page en image** (utile pour générer des aperçus) :
|
||||
```
|
||||
pdftoppm -png -r 150 document.pdf apercu
|
||||
```
|
||||
|
||||
## qpdf
|
||||
|
||||
`qpdf` est devenu le couteau suisse de référence pour la manipulation structurelle des PDF en ligne de commande. Plus rapide et mieux maintenu que pdftk, il gère la fusion, la découpe, le chiffrement, la linéarisation et la réparation de fichiers corrompus.
|
||||
|
||||
Installation :
|
||||
```
|
||||
sudo dnf install qpdf
|
||||
```
|
||||
|
||||
**Extraire une plage de pages** :
|
||||
```
|
||||
qpdf document.pdf --pages document.pdf 3-9 -- extrait.pdf
|
||||
```
|
||||
|
||||
**Fusionner plusieurs fichiers** :
|
||||
```
|
||||
qpdf --empty --pages fichier1.pdf fichier2.pdf -- fusion.pdf
|
||||
```
|
||||
|
||||
**Déchiffrer un PDF protégé par mot de passe** (dont vous connaissez le mot de passe) :
|
||||
```
|
||||
qpdf --password=motdepasse --decrypt protege.pdf libre.pdf
|
||||
```
|
||||
|
||||
**Réparer un PDF abîmé** :
|
||||
```
|
||||
qpdf --check --replace-input document.pdf
|
||||
```
|
||||
|
||||
## Ghostscript
|
||||
|
||||
Indispensable pour **compresser un PDF** ou le convertir en PDF/A pour l'archivage. Ghostscript est généralement déjà installé comme dépendance d'autres paquets, sinon :
|
||||
|
||||
```
|
||||
sudo dnf install ghostscript
|
||||
```
|
||||
|
||||
**Compresser un PDF** (idéal pour réduire la taille de scans volumineux) :
|
||||
```
|
||||
gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 \
|
||||
-dPDFSETTINGS=/ebook \
|
||||
-dNOPAUSE -dQUIET -dBATCH \
|
||||
-sOutputFile=compresse.pdf original.pdf
|
||||
```
|
||||
|
||||
Les valeurs possibles pour `-dPDFSETTINGS` vont du moins compressé au plus compressé : `/prepress`, `/printer`, `/ebook`, `/screen`.
|
||||
|
||||
## OCRmyPDF
|
||||
|
||||
Pour rendre un PDF scanné **réellement utilisable** (recherche, copier-coller du texte), OCRmyPDF ajoute une couche de texte invisible au-dessus de l'image, en s'appuyant sur Tesseract.
|
||||
|
||||
Installation :
|
||||
```
|
||||
sudo dnf install ocrmypdf tesseract-langpack-fra
|
||||
```
|
||||
|
||||
Utilisation :
|
||||
```
|
||||
ocrmypdf -l fra scan.pdf scan_ocr.pdf
|
||||
```
|
||||
|
||||
Le résultat reste visuellement identique, mais le texte devient sélectionnable et indexable.
|
||||
|
||||
## pdftk-java
|
||||
|
||||
La version Java de `pdftk` est le portage maintenu de l'outil historique, l'original ayant disparu des dépôts modernes à cause de ses dépendances obsolètes.
|
||||
|
||||
Installation :
|
||||
```
|
||||
sudo dnf install pdftk-java
|
||||
```
|
||||
|
||||
Pour les usages courants (fusion, découpe), qpdf est généralement préférable. pdftk garde un intérêt pour la manipulation de **formulaires PDF** (remplissage par fichier FDF, aplatissement) et quelques opérations spécifiques sur les signets.
|
||||
|
||||
## Stirling-PDF
|
||||
|
||||
Plus récent dans le paysage, **Stirling-PDF** est une application web auto-hébergeable qui regroupe une cinquantaine d'opérations PDF derrière une interface moderne : fusion, découpe, OCR, conversion, signature, compression, suppression de pages, etc. Elle s'installe en quelques secondes via Docker.
|
||||
|
||||
```
|
||||
docker run -d -p 8080:8080 stirlingtools/stirling-pdf:latest
|
||||
```
|
||||
|
||||
L'interface est ensuite accessible à l'adresse `http://localhost:8080`. C'est une excellente alternative aux services en ligne pour qui souhaite garder ses documents en local.
|
||||
|
||||
|
||||
## exiftool
|
||||
|
||||
Bien que principalement connu pour les métadonnées des images, **exiftool** lit et modifie aussi les métadonnées des PDF : auteur, titre, sujet, mots-clés, date de création, logiciel producteur, etc. C'est l'outil le plus complet pour cet usage précis.
|
||||
|
||||
Installation :
|
||||
```
|
||||
sudo dnf install perl-Image-ExifTool
|
||||
```
|
||||
|
||||
**Afficher toutes les métadonnées d'un PDF** :
|
||||
```
|
||||
exiftool document.pdf
|
||||
```
|
||||
|
||||
**Modifier le titre et l'auteur** :
|
||||
```
|
||||
exiftool -Title="Rapport annuel 2025" -Author="Jean Dupont" document.pdf
|
||||
```
|
||||
|
||||
Par défaut, exiftool crée une sauvegarde `document.pdf_original`. L'option `-overwrite_original` permet de s'en passer.
|
||||
|
||||
**Supprimer toutes les métadonnées** (utile avant publication ou envoi d'un document) :
|
||||
```
|
||||
exiftool -all:all= document.pdf
|
||||
```
|
||||
|
||||
**Traiter tous les PDF d'un dossier** :
|
||||
```
|
||||
exiftool -Author="Service communication" *.pdf
|
||||
```
|
||||
|
||||
> **Limite à connaître** : exiftool écrit les métadonnées dans le dictionnaire `Info` du PDF, mais certaines applications lisent plutôt le flux **XMP**. Pour une cohérence parfaite, il peut être nécessaire de mettre à jour les deux, ce qu'exiftool sait faire automatiquement avec l'option `-XMP-dc:` pour les champs Dublin Core.
|
||||
@@ -1,59 +1,56 @@
|
||||
# Manipuler des PDF sous Linux
|
||||
|
||||
Fusionner, séparer, réorganiser ou extraire le contenu d'un PDF : sous Linux, plusieurs outils — graphiques ou en ligne de commande — couvrent ces besoins. Voici une sélection des plus utiles, avec leur installation sur Fedora et un aperçu de leur usage.
|
||||
Fusionner, séparer, réorganiser, annoter ou compresser un PDF : sous Linux, plusieurs outils — graphiques ou en ligne de commande — couvrent ces besoins. Voici une sélection des plus utiles aujourd'hui, avec leur installation sur Fedora et un aperçu de leur usage.
|
||||
|
||||
## Vue d'ensemble des outils
|
||||
|
||||
| Outil | Type | Usage principal |
|
||||
|---|---|---|
|
||||
| **pdfshuffler** | Graphique | Fusionner, séparer, réordonner des pages |
|
||||
| **pdfmod** | Graphique | Modifier la structure d'un PDF |
|
||||
| **PDF Arranger** | Graphique | Fusionner, séparer, réordonner des pages |
|
||||
| **Xournal++** | Graphique | Annoter, surligner, signer |
|
||||
| **LibreOffice Draw** | Graphique | Éditer le contenu (texte, images) |
|
||||
| **Okular** | Graphique | Lecture avancée, annotations |
|
||||
| **poppler-utils** | Ligne de commande | Conversion, extraction, fusion, découpe |
|
||||
| **pdftk** | Ligne de commande | Manipulation avancée (fusion, chiffrement, formulaires) |
|
||||
| **PDF Chain** | Graphique | Interface graphique pour pdftk |
|
||||
| **qpdf** | Ligne de commande | Manipulation structurelle, chiffrement, réparation |
|
||||
| **Ghostscript** | Ligne de commande | Compression, conversion PDF/A, fusion |
|
||||
| **OCRmyPDF** | Ligne de commande | Ajout d'une couche OCR aux PDF scannés |
|
||||
| **pdftk-java** | Ligne de commande | Fusion, chiffrement, formulaires |
|
||||
| **Stirling-PDF** | Web (auto-hébergé) | Suite complète d'opérations PDF |
|
||||
| **exiftool** | Ligne de commande | Lecture et édition des métadonnées |
|
||||
|
||||
## pdfmod
|
||||
## PDF Arranger
|
||||
|
||||
Application graphique simple pour réorganiser, supprimer ou faire pivoter les pages d'un PDF.
|
||||
|
||||

|
||||
Outil graphique léger orienté glisser-déposer, idéal pour assembler ou réorganiser des pages issues de plusieurs fichiers. Successeur direct de pdfshuffler, dont il reprend l'interface, mais activement maintenu et basé sur **pikepdf**.
|
||||
|
||||
Installation :
|
||||
|
||||
```
|
||||
sudo dnf install pdfmod
|
||||
sudo dnf install pdfarranger
|
||||
```
|
||||
|
||||
L'installation tire quelques dépendances Mono/GTK# (`gtk-sharp2`, `gnome-sharp`, `poppler-sharp`, `hyena`, `nunit`), soit environ 8 Mo une fois installé.
|
||||
L'interface affiche les pages sous forme de vignettes, qu'il suffit de faire glisser pour les réordonner, supprimer, faire pivoter ou regrouper avant export. On peut ouvrir plusieurs PDF simultanément et déplacer les pages de l'un à l'autre.
|
||||
|
||||
## pdfshuffler
|
||||
> **Note** : les anciens outils **pdfshuffler** et **pdfmod** ne sont plus maintenus. pdfmod, basé sur Mono, est particulièrement à éviter aujourd'hui. PDF Arranger les remplace avantageusement.
|
||||
|
||||
Outil graphique léger orienté glisser-déposer, idéal pour assembler ou réorganiser des pages issues de plusieurs fichiers.
|
||||
## Xournal++
|
||||
|
||||

|
||||
Pour annoter, surligner, dessiner à main levée ou apposer une signature sur un PDF, Xournal++ est l'outil de référence. Il sauvegarde au format `.xopp` mais exporte en PDF avec les annotations intégrées.
|
||||
|
||||
Installation :
|
||||
|
||||
```
|
||||
sudo dnf install pdfshuffler
|
||||
sudo dnf install xournalpp
|
||||
```
|
||||
|
||||
Dépendances principales : `pyPdf` et `pypoppler`.
|
||||
## LibreOffice Draw
|
||||
|
||||
### Utilisation
|
||||
Souvent négligé, Draw ouvre directement les PDF et permet d'**éditer le texte et les objets** — fonctionnalité qu'aucun autre outil de cette liste ne propose en standard. Pratique pour corriger une faute de frappe ou modifier un visuel sans avoir le fichier source.
|
||||
|
||||
L'interface affiche les pages sous forme de vignettes, qu'il suffit de faire glisser pour les réordonner, supprimer ou regrouper avant export.
|
||||
|
||||

|
||||
LibreOffice étant généralement déjà installé, aucune action supplémentaire n'est nécessaire dans la plupart des cas.
|
||||
|
||||
## poppler-utils
|
||||
|
||||
`poppler-utils` est une collection d'outils en ligne de commande s'appuyant sur l'API **poppler** pour manipuler les fichiers PDF.
|
||||
|
||||

|
||||
|
||||
Installation :
|
||||
|
||||
```
|
||||
sudo dnf install poppler-utils
|
||||
```
|
||||
@@ -74,22 +71,150 @@ sudo dnf install poppler-utils
|
||||
|
||||
### Exemples pratiques
|
||||
|
||||
Les deux commandes les plus utiles au quotidien sont `pdfseparate` (découpe) et `pdfunite` (fusion).
|
||||
**Extraire tout le texte d'un document** :
|
||||
```
|
||||
pdftotext document.pdf
|
||||
```
|
||||
|
||||
L'option `-layout` préserve la mise en page d'origine, ce qui est précieux pour les documents contenant des tableaux :
|
||||
```
|
||||
pdftotext -layout rapport.pdf
|
||||
```
|
||||
|
||||
**Extraire toutes les pages d'un document** dans des fichiers séparés :
|
||||
|
||||
```
|
||||
pdfseparate ColoringBook.pdf ColoringBook-page_%d.pdf
|
||||
```
|
||||
|
||||
**Extraire une plage de pages** (ici les pages 3 à 9) :
|
||||
|
||||
```
|
||||
pdfseparate -f 3 -l 9 ColoringBook.pdf ColoringBook-page_%d.pdf
|
||||
```
|
||||
|
||||
**Fusionner plusieurs PDF** en un seul document (par exemple les pages 3 et 4 extraites précédemment) :
|
||||
|
||||
**Fusionner plusieurs PDF** en un seul document :
|
||||
```
|
||||
pdfunite ColoringBook-page_3.pdf ColoringBook-page_4.pdf NewColoringBook.pdf
|
||||
```
|
||||
```
|
||||
|
||||
**Convertir une page en image** (utile pour générer des aperçus) :
|
||||
```
|
||||
pdftoppm -png -r 150 document.pdf apercu
|
||||
```
|
||||
|
||||
## qpdf
|
||||
|
||||
`qpdf` est devenu le couteau suisse de référence pour la manipulation structurelle des PDF en ligne de commande. Plus rapide et mieux maintenu que pdftk, il gère la fusion, la découpe, le chiffrement, la linéarisation et la réparation de fichiers corrompus.
|
||||
|
||||
Installation :
|
||||
```
|
||||
sudo dnf install qpdf
|
||||
```
|
||||
|
||||
**Extraire une plage de pages** :
|
||||
```
|
||||
qpdf document.pdf --pages document.pdf 3-9 -- extrait.pdf
|
||||
```
|
||||
|
||||
**Fusionner plusieurs fichiers** :
|
||||
```
|
||||
qpdf --empty --pages fichier1.pdf fichier2.pdf -- fusion.pdf
|
||||
```
|
||||
|
||||
**Déchiffrer un PDF protégé par mot de passe** (dont vous connaissez le mot de passe) :
|
||||
```
|
||||
qpdf --password=motdepasse --decrypt protege.pdf libre.pdf
|
||||
```
|
||||
|
||||
**Réparer un PDF abîmé** :
|
||||
```
|
||||
qpdf --check --replace-input document.pdf
|
||||
```
|
||||
|
||||
## Ghostscript
|
||||
|
||||
Indispensable pour **compresser un PDF** ou le convertir en PDF/A pour l'archivage. Ghostscript est généralement déjà installé comme dépendance d'autres paquets, sinon :
|
||||
|
||||
```
|
||||
sudo dnf install ghostscript
|
||||
```
|
||||
|
||||
**Compresser un PDF** (idéal pour réduire la taille de scans volumineux) :
|
||||
```
|
||||
gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 \
|
||||
-dPDFSETTINGS=/ebook \
|
||||
-dNOPAUSE -dQUIET -dBATCH \
|
||||
-sOutputFile=compresse.pdf original.pdf
|
||||
```
|
||||
|
||||
Les valeurs possibles pour `-dPDFSETTINGS` vont du moins compressé au plus compressé : `/prepress`, `/printer`, `/ebook`, `/screen`.
|
||||
|
||||
## OCRmyPDF
|
||||
|
||||
Pour rendre un PDF scanné **réellement utilisable** (recherche, copier-coller du texte), OCRmyPDF ajoute une couche de texte invisible au-dessus de l'image, en s'appuyant sur Tesseract.
|
||||
|
||||
Installation :
|
||||
```
|
||||
sudo dnf install ocrmypdf tesseract-langpack-fra
|
||||
```
|
||||
|
||||
Utilisation :
|
||||
```
|
||||
ocrmypdf -l fra scan.pdf scan_ocr.pdf
|
||||
```
|
||||
|
||||
Le résultat reste visuellement identique, mais le texte devient sélectionnable et indexable.
|
||||
|
||||
## pdftk-java
|
||||
|
||||
La version Java de `pdftk` est le portage maintenu de l'outil historique, l'original ayant disparu des dépôts modernes à cause de ses dépendances obsolètes.
|
||||
|
||||
Installation :
|
||||
```
|
||||
sudo dnf install pdftk-java
|
||||
```
|
||||
|
||||
Pour les usages courants (fusion, découpe), qpdf est généralement préférable. pdftk garde un intérêt pour la manipulation de **formulaires PDF** (remplissage par fichier FDF, aplatissement) et quelques opérations spécifiques sur les signets.
|
||||
|
||||
## Stirling-PDF
|
||||
|
||||
Plus récent dans le paysage, **Stirling-PDF** est une application web auto-hébergeable qui regroupe une cinquantaine d'opérations PDF derrière une interface moderne : fusion, découpe, OCR, conversion, signature, compression, suppression de pages, etc. Elle s'installe en quelques secondes via Docker.
|
||||
|
||||
```
|
||||
docker run -d -p 8080:8080 stirlingtools/stirling-pdf:latest
|
||||
```
|
||||
|
||||
L'interface est ensuite accessible à l'adresse `http://localhost:8080`. C'est une excellente alternative aux services en ligne pour qui souhaite garder ses documents en local.
|
||||
|
||||
|
||||
## exiftool
|
||||
|
||||
Bien que principalement connu pour les métadonnées des images, **exiftool** lit et modifie aussi les métadonnées des PDF : auteur, titre, sujet, mots-clés, date de création, logiciel producteur, etc. C'est l'outil le plus complet pour cet usage précis.
|
||||
|
||||
Installation :
|
||||
```
|
||||
sudo dnf install perl-Image-ExifTool
|
||||
```
|
||||
|
||||
**Afficher toutes les métadonnées d'un PDF** :
|
||||
```
|
||||
exiftool document.pdf
|
||||
```
|
||||
|
||||
**Modifier le titre et l'auteur** :
|
||||
```
|
||||
exiftool -Title="Rapport annuel 2025" -Author="Jean Dupont" document.pdf
|
||||
```
|
||||
|
||||
Par défaut, exiftool crée une sauvegarde `document.pdf_original`. L'option `-overwrite_original` permet de s'en passer.
|
||||
|
||||
**Supprimer toutes les métadonnées** (utile avant publication ou envoi d'un document) :
|
||||
```
|
||||
exiftool -all:all= document.pdf
|
||||
```
|
||||
|
||||
**Traiter tous les PDF d'un dossier** :
|
||||
```
|
||||
exiftool -Author="Service communication" *.pdf
|
||||
```
|
||||
|
||||
> **Limite à connaître** : exiftool écrit les métadonnées dans le dictionnaire `Info` du PDF, mais certaines applications lisent plutôt le flux **XMP**. Pour une cohérence parfaite, il peut être nécessaire de mettre à jour les deux, ce qu'exiftool sait faire automatiquement avec l'option `-XMP-dc:` pour les champs Dublin Core.
|
||||
|
||||
@@ -7,13 +7,19 @@
|
||||
"featured": false,
|
||||
"published_at": "2023-02-28 20:02",
|
||||
"created_at": "2023-02-28 20:02:47",
|
||||
"updated_at": "2026-05-16 20:11:39",
|
||||
"updated_at": "2026-05-16 20:25:22",
|
||||
"revisions": [
|
||||
{
|
||||
"n": 1,
|
||||
"date": "2026-05-16 20:11:39",
|
||||
"comment": "Titre modifié, tags modifiés, contenu modifié, image de couverture modifiée",
|
||||
"title": "Manipuler des PDF sous Linux ?"
|
||||
},
|
||||
{
|
||||
"n": 2,
|
||||
"date": "2026-05-16 20:25:22",
|
||||
"comment": "Tags modifiés, contenu modifié",
|
||||
"title": "Manipuler des PDF sous Linux"
|
||||
}
|
||||
],
|
||||
"cover": "cover.png",
|
||||
@@ -25,7 +31,9 @@
|
||||
"category": "Informatique",
|
||||
"tags": {
|
||||
"tags": [
|
||||
"PDF"
|
||||
"PDF",
|
||||
"OCR",
|
||||
"PostScript"
|
||||
]
|
||||
}
|
||||
}
|
||||
|
||||
@@ -0,0 +1,95 @@
|
||||
# Manipuler des PDF sous Linux
|
||||
|
||||
Fusionner, séparer, réorganiser ou extraire le contenu d'un PDF : sous Linux, plusieurs outils — graphiques ou en ligne de commande — couvrent ces besoins. Voici une sélection des plus utiles, avec leur installation sur Fedora et un aperçu de leur usage.
|
||||
|
||||
## Vue d'ensemble des outils
|
||||
|
||||
| Outil | Type | Usage principal |
|
||||
|---|---|---|
|
||||
| **pdfshuffler** | Graphique | Fusionner, séparer, réordonner des pages |
|
||||
| **pdfmod** | Graphique | Modifier la structure d'un PDF |
|
||||
| **poppler-utils** | Ligne de commande | Conversion, extraction, fusion, découpe |
|
||||
| **pdftk** | Ligne de commande | Manipulation avancée (fusion, chiffrement, formulaires) |
|
||||
| **PDF Chain** | Graphique | Interface graphique pour pdftk |
|
||||
|
||||
## pdfmod
|
||||
|
||||
Application graphique simple pour réorganiser, supprimer ou faire pivoter les pages d'un PDF.
|
||||
|
||||

|
||||
|
||||
Installation :
|
||||
|
||||
```
|
||||
sudo dnf install pdfmod
|
||||
```
|
||||
|
||||
L'installation tire quelques dépendances Mono/GTK# (`gtk-sharp2`, `gnome-sharp`, `poppler-sharp`, `hyena`, `nunit`), soit environ 8 Mo une fois installé.
|
||||
|
||||
## pdfshuffler
|
||||
|
||||
Outil graphique léger orienté glisser-déposer, idéal pour assembler ou réorganiser des pages issues de plusieurs fichiers.
|
||||
|
||||

|
||||
|
||||
Installation :
|
||||
|
||||
```
|
||||
sudo dnf install pdfshuffler
|
||||
```
|
||||
|
||||
Dépendances principales : `pyPdf` et `pypoppler`.
|
||||
|
||||
### Utilisation
|
||||
|
||||
L'interface affiche les pages sous forme de vignettes, qu'il suffit de faire glisser pour les réordonner, supprimer ou regrouper avant export.
|
||||
|
||||

|
||||
|
||||
## poppler-utils
|
||||
|
||||
`poppler-utils` est une collection d'outils en ligne de commande s'appuyant sur l'API **poppler** pour manipuler les fichiers PDF.
|
||||
|
||||

|
||||
|
||||
Installation :
|
||||
|
||||
```
|
||||
sudo dnf install poppler-utils
|
||||
```
|
||||
|
||||
### Les commandes fournies
|
||||
|
||||
- **pdfdetach** — extrait les documents embarqués d'un PDF
|
||||
- **pdffonts** — liste les polices utilisées
|
||||
- **pdfimages** — extrait les images à leur résolution native
|
||||
- **pdfinfo** — affiche les métadonnées du document
|
||||
- **pdfseparate** — extrait des pages individuelles
|
||||
- **pdftocairo** — convertit des pages en formats vectoriels ou bitmap via cairo
|
||||
- **pdftohtml** — convertit un PDF en HTML en conservant la mise en forme
|
||||
- **pdftoppm** — convertit une page PDF en bitmap
|
||||
- **pdftops** — convertit un PDF au format PostScript imprimable
|
||||
- **pdftotext** — extrait tout le texte
|
||||
- **pdfunite** — fusionne plusieurs PDF
|
||||
|
||||
### Exemples pratiques
|
||||
|
||||
Les deux commandes les plus utiles au quotidien sont `pdfseparate` (découpe) et `pdfunite` (fusion).
|
||||
|
||||
**Extraire toutes les pages d'un document** dans des fichiers séparés :
|
||||
|
||||
```
|
||||
pdfseparate ColoringBook.pdf ColoringBook-page_%d.pdf
|
||||
```
|
||||
|
||||
**Extraire une plage de pages** (ici les pages 3 à 9) :
|
||||
|
||||
```
|
||||
pdfseparate -f 3 -l 9 ColoringBook.pdf ColoringBook-page_%d.pdf
|
||||
```
|
||||
|
||||
**Fusionner plusieurs PDF** en un seul document (par exemple les pages 3 et 4 extraites précédemment) :
|
||||
|
||||
```
|
||||
pdfunite ColoringBook-page_3.pdf ColoringBook-page_4.pdf NewColoringBook.pdf
|
||||
```
|
||||
Reference in New Issue
Block a user