1. Προϊόντα
  2.   PDF
  3.   Java
  4.   Apache PDFBox  

Apache PDFBox  

 
 

Java API για επεξεργασία εγγράφων PDF

Open Source Java Library για δημιουργία, εκτύπωση και διαίρεση ή συγχώνευση εγγράφων PDF εντός εφαρμογών Java.

Το Apache PDFBox είναι μια βιβλιοθήκη ανοιχτού κώδικα καθαρής Java για εργασία με έγγραφα PDF. Χρησιμοποιώντας αυτήν τη βιβλιοθήκη, οι προγραμματιστές Java μπορούν να αναπτύξουν προγράμματα Java που δημιουργούν νέα έγγραφα PDF και χειρίζονται τα υπάρχοντα έγγραφα PDF με ευκολία. Επιτρέπει επίσης στους προγραμματιστές να διαβάζουν και να εξάγουν περιεχόμενο από έγγραφα PDF. Επιπλέον, το PDFBox περιλαμβάνει επίσης ένα βοηθητικό πρόγραμμα γραμμής εντολών για την εκτέλεση διαφόρων λειτουργιών σε έγγραφα PDF χρησιμοποιώντας το διαθέσιμο αρχείο Jar.

Το Portable Document Format (PDF) είναι μια μορφή αρχείου που βοηθά στην παρουσίαση δεδομένων με τρόπο που είναι ανεξάρτητος από το λογισμικό εφαρμογής, το υλικό και τα λειτουργικά συστήματα. Το Apache PDFBox υποστηρίζει πολλές προηγμένες λειτουργίες, όπως δημιουργία, απόδοση, εκτύπωση, διαχωρισμός, συγχώνευση, αλλαγή, επαλήθευση και εξαγωγή κειμένου και μεταδεδομένων αρχείων PDF.

Previous Next

Ξεκινώντας με το Apache PDFBox

Πρώτα απ 'όλα, πρέπει να κάνετε λήψη της πιο πρόσφατης έκδοσης από τη σελίδα λήψη του PDFBox. Για να δημιουργήσετε με επιτυχία το PDFBox, πρέπει να εγκαταστήσετε Java 7 ή νεότερη έκδοση και Maven 3 σε. Χρησιμοποιήστε την ακόλουθη εντολή κατασκευής

Εντολή εγκατάστασης

 mvn clean instal 

Η εντολή θα μεταγλωττίσει πηγές Java και θα συσκευάσει τις δυαδικές κλάσεις σε πακέτα jar από προεπιλογή.

Java API για τη δημιουργία και τροποποίηση νέων εγγράφων PDF

Το Apache PDFBox επιτρέπει στους προγραμματιστές να δημιουργήσουν ένα νέο έγγραφο PDF από την αρχή. Μετά τη δημιουργία του εγγράφου, οι προγραμματιστές μπορούν να αποθηκεύσουν το έγγραφο στην επιθυμητή θέση. Το PDF είναι μια από τις πιο συχνά χρησιμοποιούμενες μορφές αρχείων στις μέρες μας. Τα έγγραφα PDF είναι συμβατά σε διάφορες πλατφόρμες και αντιπροσωπεύουν ένα έγγραφο ανεξάρτητα από το υλικό, το λειτουργικό σύστημα και το λογισμικό εφαρμογής που χρησιμοποιείται για τη δημιουργία του. Το PDFBox διευκολύνει επίσης τους προγραμματιστές να τροποποιήσουν υπάρχοντα έγγραφα PDF. Οι προγραμματιστές μπορούν να προσθέσουν νέες σελίδες καθώς και κείμενο σε υπάρχοντα έγγραφα σελίδας.

Δημιουργία εγγράφου PDF - Java

// Create a new PDF document
PDDocument document = new PDDocument();
// Save document
document.save("fileformat.pdf");
// Close document
document.close();

Διαχωρισμός και συγχώνευση εγγράφων PDF με χρήση Java Library

Το Apache PDFBox παρέχει τη δυνατότητα συγχώνευσης πολλαπλών εγγράφων PDF σε ένα μόνο έγγραφο PDF. Για να συγχωνεύσετε πολλά έγγραφα πρέπει πρώτα να φορτώσετε τα υπάρχοντα έγγραφα PDF και μετά να ορίσετε μια διαδρομή προς το αρχείο προορισμού. Μετά από αυτό, οι προγραμματιστές μπορούν να προσθέσουν όλα τα αρχεία προέλευσης PDF με τη σειρά που θα ήθελαν να βρουν στο τελικό συγχωνευμένο αρχείο PDF. Μπορούμε να χωρίσουμε το δεδομένο έγγραφο PDF σε πολλά αρχεία PDF. Αυτή η κλάση Splitter χρησιμοποιείται για να χωρίσει το δεδομένο έγγραφο PDF σε πολλά άλλα ξεχωριστά έγγραφα.

Συγχώνευση εγγράφων PDF - Java

// Initialize PDFMergerUtility object
PDFMergerUtility pdfMergerUtility = new PDFMergerUtility();
// Set output file path
pdfMergerUtility.setDestinationFileName("merged.pdf");
// Add source documents
pdfMergerUtility.addSource(new File("document1.pdf"));
pdfMergerUtility.addSource(new File("document2.pdf"));
// Merger documents
pdfMergerUtility.mergeDocuments(MemoryUsageSetting.setupMainMemoryOnly());

Προσθήκη και εξαγωγή εικόνων σε έγγραφα PDF μέσα σε εφαρμογές Java

Το Apache PDFBox διευκολύνει τους προγραμματιστές Java να εισάγουν εικόνες σε ένα υπάρχον έγγραφο PDF. Οι εικόνες πάντα προσθέτουν πραγματική αξία στο κομμάτι του περιεχομένου. Οι εικόνες μας βοηθούν να μάθουμε, να τραβήξουμε την προσοχή, να εξηγήσουμε έννοιες και να εμπνέουμε. Το PDFBox παρέχει μια βιβλιοθήκη για την εισαγωγή μιας εικόνας σε ένα έγγραφο PDF. Αυτή η βιβλιοθήκη χρησιμοποιεί το πρόγραμμα Java για την εισαγωγή εικόνων σε έγγραφα PDF. Το API επιτρέπει επίσης στους προγραμματιστές να εξάγουν εικόνες από το υπάρχον έγγραφο PDF και να το αποθηκεύουν στον τοπικό δίσκο.

Προσθήκη εικόνων σε PDF - Java

// Create a new PDF document
PDDocument document = new PDDocument();
// Create a new page
PDPage page = new PDPage();
// Add page
document.addPage(page);
// Initialize PDImageXObject object
PDImageXObject pdImage = PDImageXObject.createFromFile("logo.png",document);
// Initialize PDPageContentStream object
PDPageContentStream contents = new PDPageContentStream(document, page);
// Drawing image
contents.drawImage(pdImage, 70, 250);
// Close contents
contents.close();
// save document
document.save("image.pdf");

Εκτυπώστε έγγραφα PDF με διάφορους τρόπους χρησιμοποιώντας τη βιβλιοθήκη Java

Το Apache PDFBox επιτρέπει στους προγραμματιστές Java να εκτυπώσουν ένα έγγραφο PDF χρησιμοποιώντας το τυπικό API εκτύπωσης Java. Επιτρέπει στους προγραμματιστές να εκτυπώνουν έγγραφα PDF με διάφορους τρόπους. Οι προγραμματιστές μπορούν τώρα να εκτυπώσουν το έγγραφο στο πραγματικό του μέγεθος που είναι ο προτεινόμενος τρόπος εκτύπωσης. Υποστηρίζει εκτύπωση με παράθυρο διαλόγου προεπισκόπησης εκτύπωσης καθώς και προσαρμοσμένα χαρακτηριστικά. Οι προγραμματιστές μπορούν επίσης να εκτυπώσουν έγγραφα PDF χρησιμοποιώντας προσαρμοσμένο μέγεθος σελίδας και προσαρμοσμένα περιθώρια.

Εκτύπωση αρχείου PDF μέσω Java API

 import java.awt.print.PrinterException;
 import java.io.IOException;
 import org.apache.pdfbox.pdmodel.PDDocument;
 public class Print {
public static void main(String[] args) throws IOException, PrinterException
{
  PDDocument pdf=PDDocument.load("d:\\filename.pdf");
      pdf.print();
}
}
 Ελληνικά