DEV Community

Liam Anderson
Liam Anderson

Posted on

Comment diviser des documents PDF avec Python

Parfois, vous n'avez besoin que de certaines pages d'un document PDF plutôt que du fichier entier. La division vous permet d'extraire et de sauvegarder uniquement les pages dont vous avez besoin, ce qui facilite le travail avec les informations pertinentes. Dans cet article, nous vous montrerons comment diviser des documents PDF en utilisant Python.

Installer la bibliothèque requise

Avant de commencer le processus de division d'un document PDF, il est essentiel d'installer la bibliothèque nécessaire. Dans cet article, nous utiliserons la bibliothèque Spire.PDF for Python, qui vous permet de créer, lire, convertir et manipuler des fichiers PDF en Python.

Pour installer cette bibliothèque, ouvrez le terminal de votre projet et exécutez la commande pip suivante :

pip install Spire.Pdf 
Enter fullscreen mode Exit fullscreen mode

Diviser des documents PDF avec Python

Avec Spire.PDF for Python, vous pouvez diviser un fichier PDF en plusieurs fichiers PDF d'une seule page, ainsi que diviser un PDF en fonction de plages de pages spécifiques.

Exemple 1. Diviser un fichier PDF en plusieurs fichiers PDF d'une seule page en Python

L'exemple de code suivant montre comment diviser un fichier PDF en plusieurs fichiers PDF d'une seule page en utilisant Python et Spire.PDF for Python :

from spire.pdf.common import * 
from spire.pdf import * 

# Créer un objet PdfDocument 
doc = PdfDocument() 
# Charger un fichier PDF 
doc.LoadFromFile("Example.pdf") 

# Diviser le fichier PDF en plusieurs fichiers PDF d'une seule page 
doc.Split("Output/SplitDocument-{0}.pdf", 1) 

# Fermer l'objet PdfDocument 
doc.Close() 
Enter fullscreen mode Exit fullscreen mode

Exemple 2. Diviser un fichier PDF en fonction de plages de pages en Python

L'exemple de code suivant montre comment diviser un fichier PDF en plusieurs fichiers PDF en fonction de plages de pages en utilisant Python et Spire.PDF for Python :

from spire.pdf.common import * 
from spire.pdf import * 

# Créer un objet PdfDocument 
doc = PdfDocument() 
# Charger un fichier PDF 
doc.LoadFromFile("Exemple.pdf") 

# Créer trois objets PdfDocument 
newDoc_1 = PdfDocument() 
newDoc_2 = PdfDocument() 
newDoc_3 = PdfDocument() 

# Insérer la première page du fichier source dans le premier document 
newDoc_1.InsertPage(doc, 0) 

# Insérer les pages 2 à 4 du fichier source dans le deuxième document 
newDoc_2.InsertPageRange(doc, 1, 3) 

# Insérer les pages restantes du fichier source dans le troisième document 
newDoc_3.InsertPageRange(doc, 4, doc.Pages.Count - 1) 

# Enregistrer les trois documents 
newDoc_1.SaveToFile("Output/Split-1.pdf") 
newDoc_2.SaveToFile("Output/Split-2.pdf") 
newDoc_3.SaveToFile("Output/Split-3.pdf") 

# Fermer les objets PdfDocument 
doc.Close() 
newDoc_1.Close() 
newDoc_2.Close() 
newDoc_3.Close() 
Enter fullscreen mode Exit fullscreen mode

Conclusion

La division de documents PDF est une technique précieuse pour améliorer la gestion des documents et l'efficacité du flux de travail. En utilisant le code présenté dans cet article, vous pouvez facilement automatiser le processus de division des documents PDF en utilisant Python.

Sujets connexes

Top comments (0)