1. Productos
  2.   PDF
  3.   Java
  4.   Apache PDFBox  

Apache PDFBox  

 
 

API de Java para el procesamiento de documentos PDF

Biblioteca Java de código abierto para crear, imprimir y dividir o combinar documentos PDF dentro de aplicaciones Java.

Apache PDFBox es una biblioteca de Java puro de código abierto para trabajar con documentos PDF. Con esta biblioteca, los desarrolladores de Java pueden desarrollar programas Java que crean nuevos documentos PDF y manipulan documentos PDF existentes con facilidad. También permite a los desarrolladores leer y extraer contenido de documentos PDF. Además de esto, PDFBox también incluye una utilidad de línea de comandos para realizar varias operaciones en documentos PDF utilizando el archivo Jar disponible.

El formato de documento portátil (PDF) es un formato de archivo que ayuda a presentar los datos de manera independiente del software, el hardware y los sistemas operativos de la aplicación. Apache PDFBox admite varias funciones avanzadas, como crear, renderizar, imprimir, dividir, fusionar, modificar, verificar y extraer texto y metadatos de archivos PDF.

Previous Next

Primeros pasos con Apache PDFBox

En primer lugar, debe descargar la última versión de la página de descarga de PDFBox. Para compilar PDFBox con éxito, debe instalar Java 7 o superior y Maven 3. Use el siguiente comando de compilación

Comando de instalación

 mvn clean instal 

El comando compilará las fuentes de Java y empaquetará las clases binarias en paquetes jar de forma predeterminada.

API de Java para crear y modificar nuevos documentos PDF

Apache PDFBox permite a los programadores generar un nuevo documento PDF desde cero. Después de crear el documento, los desarrolladores pueden guardarlo en la ubicación deseada. PDF es uno de los formatos de archivo más utilizados hoy en día. Los documentos PDF son compatibles en varias plataformas y representan un documento independientemente del hardware, el sistema operativo y el software de aplicación utilizado para crearlo. PDFBox también facilita a los desarrolladores la modificación de documentos PDF existentes. Los desarrolladores pueden agregar nuevas páginas, así como texto a los documentos de página existentes.

Crear documento PDF - Java

// Create a new PDF document
PDDocument document = new PDDocument();
// Save document
document.save("fileformat.pdf");
// Close document
document.close();

Dividir y fusionar documentos PDF usando la biblioteca de Java

Apache PDFBox proporciona la capacidad de fusionar múltiples documentos PDF en un solo documento PDF. Para combinar varios documentos, primero debe cargar los documentos PDF existentes y luego establecer una ruta al archivo de destino. Después de eso, los desarrolladores pueden agregar todos los archivos PDF de origen en la secuencia que les gustaría encontrar en el archivo PDF fusionado final. Podemos dividir el documento PDF dado en varios archivos PDF. Esta clase Splitter se usa para dividir el documento PDF dado en varios otros documentos separados.

Fusionar documentos PDF - Java

// Initialize PDFMergerUtility object
PDFMergerUtility pdfMergerUtility = new PDFMergerUtility();
// Set output file path
pdfMergerUtility.setDestinationFileName("merged.pdf");
// Add source documents
pdfMergerUtility.addSource(new File("document1.pdf"));
pdfMergerUtility.addSource(new File("document2.pdf"));
// Merger documents
pdfMergerUtility.mergeDocuments(MemoryUsageSetting.setupMainMemoryOnly());

Agregue y extraiga imágenes a documentos PDF dentro de aplicaciones Java

Apache PDFBox facilita a los desarrolladores de Java insertar imágenes en un documento PDF existente. Las imágenes siempre agregan valor real a la pieza de contenido. Las imágenes nos ayudan a aprender, captar la atención, explicar conceptos e inspirar. PDFBox proporciona una biblioteca para insertar una imagen en un documento PDF. Esta biblioteca utiliza el programa Java para insertar imágenes en documentos PDF. La API también permite a los desarrolladores extraer imágenes del documento PDF existente y almacenarlo en el disco local.

Añadir imágenes en PDF - Java

// Create a new PDF document
PDDocument document = new PDDocument();
// Create a new page
PDPage page = new PDPage();
// Add page
document.addPage(page);
// Initialize PDImageXObject object
PDImageXObject pdImage = PDImageXObject.createFromFile("logo.png",document);
// Initialize PDPageContentStream object
PDPageContentStream contents = new PDPageContentStream(document, page);
// Drawing image
contents.drawImage(pdImage, 70, 250);
// Close contents
contents.close();
// save document
document.save("image.pdf");

Imprima documentos PDF de varias maneras usando la biblioteca de Java

Apache PDFBox permite a los desarrolladores de Java imprimir un documento PDF utilizando la API de impresión estándar de Java. Permite a los desarrolladores imprimir documentos PDF de varias formas. Los desarrolladores ahora pueden imprimir el documento en su tamaño real, que es la forma recomendada de imprimir. Admite la impresión con un cuadro de diálogo de vista previa de impresión, así como atributos personalizados. Los desarrolladores también pueden imprimir documentos PDF utilizando un tamaño de página personalizado y márgenes personalizados.

Imprimir archivo PDF a través de la API de Java

 import java.awt.print.PrinterException;
 import java.io.IOException;
 import org.apache.pdfbox.pdmodel.PDDocument;
 public class Print {
public static void main(String[] args) throws IOException, PrinterException
{
  PDDocument pdf=PDDocument.load("d:\\filename.pdf");
      pdf.print();
}
}
 Español