1. Produkty
  2.   PDF
  3.   Java
  4.   Apache PDFBox  

Apache PDFBox  

 
 

Java API do przetwarzania dokumentów PDF

Biblioteka Open Source Java do tworzenia, drukowania i dzielenia lub scalania dokumentów PDF w aplikacjach Java.

Apache PDFBox to biblioteka open source w czystej postaci Java do pracy z dokumentami PDF. Korzystając z tej biblioteki, programiści Java mogą tworzyć programy Java, które tworzą nowe dokumenty PDF i z łatwością manipulują istniejącymi dokumentami PDF. Umożliwia także programistom odczytywanie i wyodrębnianie treści z dokumentów PDF. Oprócz tego PDFBox zawiera również narzędzie wiersza poleceń do wykonywania różnych operacji na dokumentach PDF przy użyciu dostępnego pliku Jar.

Portable Document Format (PDF) to format pliku, który pomaga prezentować dane w sposób niezależny od oprogramowania, sprzętu i systemów operacyjnych. Apache PDFBox obsługuje kilka zaawansowanych funkcji, takich jak tworzenie, renderowanie, drukowanie, dzielenie, scalanie, zmienianie, weryfikacja i wyodrębnianie tekstu i metadanych z plików PDF.

Previous Next

Pierwsze kroki z Apache PDFBox

Przede wszystkim musisz pobrać najnowszą wersję ze strony pobierania PDFBox. Aby pomyślnie zbudować PDFBox, musisz zainstalować Javę 7 lub nowszą i Maven 3 do. Użyj następującego polecenia budowania

Polecenie instalacji

 mvn clean instal 

Polecenie skompiluje źródła Java i domyślnie spakuje klasy binarne w pakiety jar.

Java API do tworzenia i modyfikowania nowych dokumentów PDF

Apache PDFBox umożliwia programistom generowanie nowego dokumentu PDF od podstaw. Po utworzeniu dokumentu programiści mogą zapisać dokument w wybranej lokalizacji. PDF jest obecnie jednym z najczęściej używanych formatów plików. Dokumenty PDF są kompatybilne na różnych platformach i reprezentują dokument niezależnie od sprzętu, systemu operacyjnego i oprogramowania użytego do jego utworzenia. PDFBox ułatwia również programistom modyfikowanie istniejących dokumentów PDF. Deweloperzy mogą dodawać nowe strony, a także tekst do istniejących dokumentów stron.

Utwórz dokument PDF — Java

// Create a new PDF document
PDDocument document = new PDDocument();
// Save document
document.save("fileformat.pdf");
// Close document
document.close();

Dzielenie i łączenie dokumentów PDF przy użyciu biblioteki Java

Apache PDFBox zapewnia możliwość łączenia wielu dokumentów PDF w jeden dokument PDF. Aby scalić wiele dokumentów, najpierw musisz załadować istniejące dokumenty PDF, a następnie ustawić ścieżkę do pliku docelowego. Następnie programiści mogą dodać wszystkie źródłowe pliki PDF w kolejności, jaką chcieliby znaleźć w końcowym scalonym pliku PDF. Możemy podzielić dany dokument PDF na wiele plików PDF. Ta klasa Splitter służy do dzielenia danego dokumentu PDF na kilka innych oddzielnych dokumentów.

Scalanie dokumentów PDF — Java

// Initialize PDFMergerUtility object
PDFMergerUtility pdfMergerUtility = new PDFMergerUtility();
// Set output file path
pdfMergerUtility.setDestinationFileName("merged.pdf");
// Add source documents
pdfMergerUtility.addSource(new File("document1.pdf"));
pdfMergerUtility.addSource(new File("document2.pdf"));
// Merger documents
pdfMergerUtility.mergeDocuments(MemoryUsageSetting.setupMainMemoryOnly());

Dodaj i wyodrębnij obrazy do dokumentów PDF w aplikacjach Java

Apache PDFBox ułatwia programistom Java wstawianie obrazów do istniejącego dokumentu PDF. Obrazy zawsze dodają prawdziwej wartości treści. Obrazy pomagają nam uczyć się, przyciągać uwagę, wyjaśniać pojęcia i inspirować. PDFBox udostępnia bibliotekę do wstawiania obrazu do dokumentu PDF. Ta biblioteka wykorzystuje program Java do wstawiania obrazów w dokumentach PDF. Interfejs API umożliwia również programistom wyodrębnianie obrazów z istniejącego dokumentu PDF i przechowywanie ich na dysku lokalnym.

Dodaj obrazy w formacie PDF — Java

// Create a new PDF document
PDDocument document = new PDDocument();
// Create a new page
PDPage page = new PDPage();
// Add page
document.addPage(page);
// Initialize PDImageXObject object
PDImageXObject pdImage = PDImageXObject.createFromFile("logo.png",document);
// Initialize PDPageContentStream object
PDPageContentStream contents = new PDPageContentStream(document, page);
// Drawing image
contents.drawImage(pdImage, 70, 250);
// Close contents
contents.close();
// save document
document.save("image.pdf");

Drukuj dokumenty PDF na różne sposoby za pomocą biblioteki Java

Apache PDFBox umożliwia programistom Java drukowanie dokumentów PDF przy użyciu standardowego interfejsu API drukowania Java. Umożliwia programistom drukowanie dokumentów PDF na różne sposoby. Deweloperzy mogą teraz drukować dokument w jego rzeczywistym rozmiarze, co jest zalecanym sposobem drukowania. Obsługuje drukowanie z oknem podglądu wydruku, a także niestandardowymi atrybutami. Deweloperzy mogą również drukować dokumenty PDF przy użyciu niestandardowego rozmiaru strony i niestandardowych marginesów.

Wydrukuj plik PDF za pomocą Java API

 import java.awt.print.PrinterException;
 import java.io.IOException;
 import org.apache.pdfbox.pdmodel.PDDocument;
 public class Print {
public static void main(String[] args) throws IOException, PrinterException
{
  PDDocument pdf=PDDocument.load("d:\\filename.pdf");
      pdf.print();
}
}
 Polski