1. Des produits
  2.   PDF
  3.   Java
  4.   Apache PDFBox  

Apache PDFBox  

 
 

API Java pour le traitement des documents PDF

Open Source Java Library pour créer, imprimer et diviser ou fusionner des documents PDF dans des applications Java.

Apache PDFBox est une bibliothèque open source purement Java pour travailler avec des documents PDF. À l'aide de cette bibliothèque, les développeurs Java peuvent développer des programmes Java qui créent de nouveaux documents PDF et manipulent facilement des documents PDF existants. Il permet également aux développeurs de lire et d'extraire le contenu des documents PDF. En plus de cela, PDFBox comprend également un utilitaire de ligne de commande pour effectuer diverses opérations sur des documents PDF à l'aide du fichier Jar disponible.

Le format de document portable (PDF) est un format de fichier qui aide à présenter les données d'une manière indépendante du logiciel d'application, du matériel et des systèmes d'exploitation. Apache PDFBox prend en charge plusieurs fonctionnalités avancées, telles que la création, le rendu, l'impression, le fractionnement, la fusion, la modification, la vérification et l'extraction de texte et de métadonnées de fichiers PDF.

Previous Next

Premiers pas avec Apache PDFBox

Tout d'abord, vous devez télécharger la dernière version depuis la page de téléchargement de PDFBox. Pour construire PDFBox avec succès, vous devez installer Java 7 ou supérieur et Maven 3. Utilisez la commande de construction suivante

Commande d'installation

 mvn clean instal 

La commande compilera les sources Java et empaquetera les classes binaires dans des packages jar par défaut.

API Java pour créer et modifier de nouveaux documents PDF

Apache PDFBox permet aux programmeurs de générer un nouveau document PDF à partir de zéro. Après avoir créé le document, les développeurs peuvent enregistrer le document à l'emplacement souhaité. Le PDF est l'un des formats de fichiers les plus couramment utilisés de nos jours. Les documents PDF sont compatibles sur diverses plates-formes et représentent un document indépendamment du matériel, du système d'exploitation et du logiciel d'application utilisés pour le créer. PDFBox permet également aux développeurs de modifier les documents PDF existants. Les développeurs peuvent ajouter de nouvelles pages ainsi que du texte aux documents de page existants.

Créer un document PDF - Java

// Create a new PDF document
PDDocument document = new PDDocument();
// Save document
document.save("fileformat.pdf");
// Close document
document.close();

Fractionner et fusionner des documents PDF à l'aide de la bibliothèque Java

Apache PDFBox offre la possibilité de fusionner plusieurs documents PDF en un seul document PDF. Pour fusionner plusieurs documents, vous devez d'abord charger des documents PDF existants, puis définir un chemin vers le fichier de destination. Après cela, les développeurs peuvent ajouter tous les fichiers PDF source dans l'ordre qu'ils souhaitent trouver dans le fichier PDF fusionné final. Nous pouvons diviser le document PDF donné en plusieurs fichiers PDF. Cette classe Splitter est utilisée pour diviser le document PDF donné en plusieurs autres documents distincts.

Fusionner des documents PDF - Java

// Initialize PDFMergerUtility object
PDFMergerUtility pdfMergerUtility = new PDFMergerUtility();
// Set output file path
pdfMergerUtility.setDestinationFileName("merged.pdf");
// Add source documents
pdfMergerUtility.addSource(new File("document1.pdf"));
pdfMergerUtility.addSource(new File("document2.pdf"));
// Merger documents
pdfMergerUtility.mergeDocuments(MemoryUsageSetting.setupMainMemoryOnly());

Ajouter et extraire des images dans des documents PDF dans des applications Java

Apache PDFBox permet aux développeurs Java d'insérer des images dans un document PDF existant. Les images ajoutent toujours une valeur réelle au contenu. Les images nous aident à apprendre, à attirer l'attention, à expliquer des concepts et à inspirer. PDFBox fournit une bibliothèque pour insérer une image dans un document PDF. Cette bibliothèque utilise le programme Java pour insérer des images dans les documents PDF. L'API permet également aux développeurs d'extraire des images du document PDF existant et de les stocker sur le disque local.

Ajouter des images au format PDF - Java

// Create a new PDF document
PDDocument document = new PDDocument();
// Create a new page
PDPage page = new PDPage();
// Add page
document.addPage(page);
// Initialize PDImageXObject object
PDImageXObject pdImage = PDImageXObject.createFromFile("logo.png",document);
// Initialize PDPageContentStream object
PDPageContentStream contents = new PDPageContentStream(document, page);
// Drawing image
contents.drawImage(pdImage, 70, 250);
// Close contents
contents.close();
// save document
document.save("image.pdf");

Imprimer des documents PDF de différentes manières à l'aide de la bibliothèque Java

Apache PDFBox permet aux développeurs Java d'imprimer un document PDF à l'aide de l'API d'impression Java standard. Il permet aux développeurs d'imprimer des documents PDF de différentes manières. Les développeurs peuvent désormais imprimer le document à sa taille réelle, ce qui est la méthode d'impression recommandée. Il prend en charge l'impression avec une boîte de dialogue d'aperçu avant impression ainsi que des attributs personnalisés. Les développeurs peuvent également imprimer des documents PDF en utilisant une taille de page personnalisée et des marges personnalisées.

Imprimer un fichier PDF via l'API Java

 import java.awt.print.PrinterException;
 import java.io.IOException;
 import org.apache.pdfbox.pdmodel.PDDocument;
 public class Print {
public static void main(String[] args) throws IOException, PrinterException
{
  PDDocument pdf=PDDocument.load("d:\\filename.pdf");
      pdf.print();
}
}
 Français