DEV Community

SirOnly
SirOnly

Posted on

Mit Python Eigenschaften von PDF-Dokumenten festlegen

PDF-Dokumenteigenschaften sind dokumentenbezogene Informationen, die in einem Dokument eingebettet sind und den Autor, das Erstellungsdatum, den Titel usw. umfassen. PDF-Dokumenteigenschaften können Standard- und benutzerdefinierte Eigenschaften haben. Die Standard-Eigenschaften können aus konfigurierbaren Teilen und automatisch generierten Teilen bestehen. Benutzer können durch Anzeige der Dokumenteigenschaften in einem PDF-Reader schnell auf wichtige Informationen zum Dokument zugreifen. Das Verständnis der Methoden zur Einstellung und Abfrage dieser Dokumentinformationen ist äußerst nützlich, um benutzerdefinierte Dokumente zu erstellen oder viele Dokumente zu verarbeiten. In diesem Artikel wird gezeigt, wie Sie mit Python-Programmen die Eigenschaften von PDF-Dokumenten einstellen und abrufen können.

Die in diesem Artikel verwendete Methode erfordert Spire.PDF for Python. Sie können es entweder von der offiziellen Website herunterladen oder direkt über pip installieren:

pip install Spire.PDF
Enter fullscreen mode Exit fullscreen mode

Einstellung der PDF-Dokumenteigenschaften

Spire.PDF for Python bietet die Klasse PdfDocumentInformation, um die Eigenschaften eines PDF-Dokuments zu verarbeiten. Diese Klasse verfügt über mehrere Eigenschaften zum Festlegen der Standarddokumenteigenschaften wie Autor, Thema, Stichwörter usw. Darüber hinaus können Sie mit der Methode PdfDocumentInformation.SetCustomProperty() benutzerdefinierte Eigenschaften für das PDF-Dokument festlegen. Hier sind detaillierte Schritte zum Festlegen der PDF-Eigenschaften:

  1. Erstellen Sie ein Objekt der Klasse PdfDocument und laden Sie das PDF-Dokument mit der Methode PdfDocument.LoadFromFile().
  2. Verwenden Sie die Eigenschaft PdfDocument.DocumentInformation, um die Eigenschaften des PDF-Dokuments abzurufen.
  3. Verwenden Sie die Eigenschaften der Klasse PdfDocumentInformation, um die Standarddokumenteigenschaften festzulegen.
  4. Verwenden Sie die Methode PdfDocumentInformation.SetCustomProperty(), um benutzerdefinierte Eigenschaften für das Dokument festzulegen.
  5. Verwenden Sie die Methode PdfDocument.SaveToFile(), um das Dokument zu speichern.

Codebeispiel
Python

from spire.pdf import *
from spire.pdf.common import *

# Erstellen Sie ein Objekt der Klasse PdfDocument und laden Sie das PDF-Dokument
pdf = PdfDocument()
pdf.LoadFromFile("Beispiel.pdf")

# Dokumenteigenschaften abrufen
properties = pdf.DocumentInformation

# Eingebaute Eigenschaften festlegen
properties.Author = "Johan"
properties.Creator = "Spire.PDF"
properties.Keywords = "Cloud-Services; Digitalgeschäft"
properties.Subject = "Einführung in Cloud-Services und ihre Vorteile"
properties.Title = "Die Kraft der Cloud-Services: Digitale Unternehmen stärken"
properties.Producer = "Spire.PDF für Python"

# Benutzerdefinierte Eigenschaften festlegen
properties.SetCustomProperty("Firma", "E-iceblue")
properties.SetCustomProperty("Tags", "Cloud; Digitalgeschäft; Server")

# Dokument speichern
pdf.SaveToFile("output/PDF-Eigenschaften einstellen.pdf")
pdf.Close()
Enter fullscreen mode Exit fullscreen mode

Ergebnis-Dokument

Einstellung der PDF-Dokumenteigenschaften

Abrufen der PDF-Dokumenteigenschaften

Informationen zu den Standard-PDF-Eigenschaften können mit den Eigenschaften der Klasse PdfDocumentInformation abgerufen werden. Informationen zu benutzerdefinierten PDF-Eigenschaften müssen mit der Methode PdfDocumentInformation.GetCustomProperty() abgerufen werden. Hier sind die spezifischen Schritte zum Abrufen der PDF-Eigenschaften:

  1. Erstellen Sie ein Objekt der Klasse PdfDocument und laden Sie das PDF-Dokument mit der Methode PdfDocument.LoadFromFile().
  2. Verwenden Sie die Eigenschaft PdfDocument.DocumentInformation, um auf die Dokumenteigenschaften zuzugreifen.
  3. Verwenden Sie die Eigenschaften der Klasse PdfDocumentInformation, um Informationen zu den integrierten Attributen abzurufen, z. B. Autor, Titel, Stichwörter usw. Sie können direkt auf diese Eigenschaften zugreifen.
  4. Verwenden Sie die Methode PdfDocumentInformation.GetCustomProperty(), um Informationen zu benutzerdefinierten Attributen abzurufen. Sie müssen den Attributnamen in dieser Methode angeben, um den Inhalt des benutzerdefinierten Attributs abzurufen.
  5. Geben Sie den Inhalt der abgerufenen Eigenschaften aus.

Codebeispiel
Python

from spire.pdf import *
from spire.pdf.common import *

# Erstellen Sie ein Objekt der Klasse PdfDocument und laden Sie das PDF-Dokument
pdf = PdfDocument()
pdf.LoadFromFile("output/PDF-Eigenschaften einstellen.pdf")

# Dokumenteigenschaften abrufen
properties = pdf.DocumentInformation

# Eine Zeichenfolge erstellen
information = ""

# Eingebaute Eigenschaften abrufen
information += "Verfasser: " + properties.Author
information += "\nTitel: " + properties.Title
information += "\nThema: " + properties.Subject
information += "\nStichwörter: " + properties.Keywords
information += "\nAnwendung: " + properties.Creator
information += "\nPDF erstellt mit: " + properties.Producer

# Benutzerdefinierte Eigenschaften abrufen
information += "\nFirma: " + properties.GetCustomProperty("Firma")
information += "\nTags: " + properties.GetCustomProperty("Tags")

# Dokumenteigenschaften ausgeben
print(information)
pdf.Close()
Enter fullscreen mode Exit fullscreen mode

Ergebnis-Dokument

Abrufen der PDF-Dokumenteigenschaften

Oben wird erläutert, wie Sie mit Python Informationen zu den Eigenschaften von PDF-Dokumenten einstellen oder abrufen können. Weitere Funktionen finden Sie in den Spire.PDF for Python-Tutorials.

Top comments (0)