Das Extrahieren von Bildern aus PDF-Dokumenten ist eine häufig gestellte Anforderung. Es gibt viele PDF-Bibliotheken, die diese Funktion unterstützen. Eine dieser Bibliotheken ist Free Spire.PDF for Java. In diesem Artikel werden wir diskutieren, wie Sie Free Spire.PDF for Java verwenden können, um Bilder aus PDF-Dokumenten zu extrahieren.
Free Spire.PDF for Java zu Ihrem Programm hinzufügen:
Bevor wir beginnen können, müssen wir Free Spire.PDF for Java zu unserem Programm hinzufügen. Hier sind die Schritte dafür:
- Laden Sie die Free Spire.PDF for Java-Bibliothek von der offiziellen Website herunter.
- Entpacken Sie die heruntergeladene Datei und speichern Sie die Bibliotheksdatei (.jar) an einem geeigneten Ort in Ihrem Projektordner.
- Fügen Sie das .jar-File in Ihren Build-Pfad ein. Importieren Sie die Free Spire.PDF-Bibliothek in Ihrem Java-Programm.
Wie man Bilder aus PDF-Dokumenten extrahiert
Jetzt können wir damit beginnen, Bilder aus PDF-Dokumenten zu extrahieren.
- Schritt 1: Laden Sie das PDF-Dokument, aus dem Sie Bilder extrahieren möchten.
- Schritt 2: Iterieren Sie durch die Seiten des Dokuments.
- Schritt 3: Extrahieren Sie die Bilder von jeder Seite und speichern Sie sie im gewünschten Ausgabeverzeichnis.
Hier ist ein vollständiges Java-Beispiel, das den Prozess demonstriert:
import com.spire.pdf.*;
import com.spire.pdf.graphics.*;
import java.awt.image.BufferedImage;
import java.io.File;
import javax.imageio.ImageIO;
public class ExtractImages {
public static void main(String[] args) {
// Laden Sie das PDF-Dokument
PdfDocument document = new PdfDocument();
document.loadFromFile("input.pdf");
// Initialisierung der Bildanzahl
int imageCount = 0;
// Iterieren Sie durch die Seiten des Dokuments
for (int i = 0; i < document.getPages().getCount(); i++) {
// Abrufen der aktuellen Seite
PdfPageBase page = document.getPages().get(i);
// Bilder aus der aktuellen Seite extrahieren
PdfImageCollection images = page.getImages();
// Speichern Sie die extrahierten Bilder
for (int j = 0; j < images.getCount(); j++) {
BufferedImage image = images.get(j).toImage();
File output = new File("Image_" + (++imageCount) + ".png");
try {
ImageIO.write(image, "png", output);
} catch (Exception e) {
e.printStackTrace();
}
}
}
// Schließen Sie das PDF-Dokument
document.close();
System.out.println("Images extracted successfully!");
}
}
Dieser Code lädt zunächst das PDF-Eingabedokument und initialisiert einen Bildzähler. Dann durchläuft er jede Seite des Dokuments, extrahiert Bilder von jeder Seite und speichert sie als PNG-Dateien im aktuellen Arbeitsverzeichnis.
Free Spire.PDF für Java bietet viele weitere Funktionen neben der Möglichkeit, Bilder aus PDF-Dokumenten zu extrahieren. Hier sind sechs weitere Funktionen:
Top comments (0)