Apache PDFBox
Java API pro zpracování dokumentů PDF
Otevřete zdrojovou Java Library a vytvářejte, tiskněte a rozdělujte nebo slučujte dokumenty PDF v aplikacích Java.
Apache PDFBox je open source čistě Java knihovna pro práci s PDF dokumenty. Pomocí této knihovny mohou vývojáři Java vyvíjet programy Java, které snadno vytvářejí nové dokumenty PDF a manipulují se stávajícími dokumenty PDF. Umožňuje také vývojářům číst a extrahovat obsah z dokumentů PDF. Kromě toho PDFBox obsahuje také nástroj příkazového řádku pro provádění různých operací nad dokumenty PDF pomocí dostupného souboru Jar.
Portable Document Format (PDF) je formát souboru, který pomáhá prezentovat data způsobem, který je nezávislý na aplikačním softwaru, hardwaru a operačních systémech. Apache PDFBox podporuje několik pokročilých funkcí, jako je vytváření, vykreslování, tisk, rozdělování, slučování, pozměňování, ověřování a extrahování textu a metadat souborů PDF.
Začínáme s Apache PDFBox
Nejprve si musíte stáhnout nejnovější verzi ze stránky stažení PDFBoxu. Chcete-li úspěšně sestavit PDFBox, musíte nainstalovat Java 7 nebo vyšší a Maven 3. Použijte následující příkaz sestavení
Instalační příkaz
mvn clean instal
Příkaz zkompiluje zdroje Java a ve výchozím nastavení zabalí binární třídy do balíčků jar.
Java API pro vytváření a úpravu nových dokumentů PDF
Apache PDFBox umožňuje programátorům generovat nový dokument PDF od začátku. Po vytvoření dokumentu mohou vývojáři dokument uložit na požadované místo. PDF je v současnosti jedním z nejpoužívanějších formátů souborů. Dokumenty PDF jsou kompatibilní na různých platformách a představují dokument nezávisle na hardwaru, operačním systému a aplikačním softwaru použitém k jeho vytvoření. PDFBox také usnadňuje vývojářům upravovat stávající dokumenty PDF. Vývojáři mohou přidávat nové stránky i text ke stávajícím stránkovým dokumentům.
Vytvořit dokument PDF - Java
// Create a new PDF document
PDDocument document = new PDDocument();
// Save document
document.save("fileformat.pdf");
// Close document
document.close();
Rozdělení a sloučení dokumentů PDF pomocí knihovny Java
Apache PDFBox poskytuje možnost sloučit více dokumentů PDF do jednoho dokumentu PDF. Chcete-li sloučit více dokumentů, musíte nejprve načíst existující dokumenty PDF a poté nastavit cestu k cílovému souboru. Poté mohou vývojáři přidat všechny zdrojové soubory PDF v pořadí, které by chtěli najít ve finálním sloučeném souboru PDF. Daný PDF dokument můžeme rozdělit do více PDF souborů. Tato třída Splitter se používá k rozdělení daného PDF dokumentu na několik dalších samostatných dokumentů.
Sloučit dokumenty PDF - Java
// Initialize PDFMergerUtility object
PDFMergerUtility pdfMergerUtility = new PDFMergerUtility();
// Set output file path
pdfMergerUtility.setDestinationFileName("merged.pdf");
// Add source documents
pdfMergerUtility.addSource(new File("document1.pdf"));
pdfMergerUtility.addSource(new File("document2.pdf"));
// Merger documents
pdfMergerUtility.mergeDocuments(MemoryUsageSetting.setupMainMemoryOnly());
Přidejte a extrahujte obrázky do dokumentů PDF v Java Apps
Apache PDFBox usnadňuje vývojářům v jazyce Java vkládat obrázky do existujícího dokumentu PDF. Obrázky vždy přidávají obsahu skutečnou hodnotu. Obrázky nám pomáhají učit se, upoutat pozornost, vysvětlit pojmy a inspirovat. PDFBox poskytuje knihovnu pro vložení obrázku do dokumentu PDF. Tato knihovna používá program Java pro vkládání obrázků do dokumentů PDF. Rozhraní API také umožňuje vývojářům extrahovat obrázky ze stávajícího dokumentu PDF a uložit jej na místní disk.
Přidat obrázky v PDF - Java
// Create a new PDF document
PDDocument document = new PDDocument();
// Create a new page
PDPage page = new PDPage();
// Add page
document.addPage(page);
// Initialize PDImageXObject object
PDImageXObject pdImage = PDImageXObject.createFromFile("logo.png",document);
// Initialize PDPageContentStream object
PDPageContentStream contents = new PDPageContentStream(document, page);
// Drawing image
contents.drawImage(pdImage, 70, 250);
// Close contents
contents.close();
// save document
document.save("image.pdf");
Tiskněte dokumenty PDF různými způsoby pomocí knihovny Java
Apache PDFBox umožňuje vývojářům v jazyce Java tisknout dokument PDF pomocí standardního tiskového rozhraní Java API. Umožňuje vývojářům tisknout dokumenty PDF různými způsoby. Vývojáři nyní mohou vytisknout dokument v jeho skutečné velikosti, což je doporučený způsob tisku. Podporuje tisk s dialogem náhledu tisku a také vlastními atributy. Vývojáři mohou také tisknout dokumenty PDF pomocí vlastní velikosti stránky a vlastních okrajů.
Tisk souboru PDF přes Java API
import java.awt.print.PrinterException;
import java.io.IOException;
import org.apache.pdfbox.pdmodel.PDDocument;
public class Print {
public static void main(String[] args) throws IOException, PrinterException
{
PDDocument pdf=PDDocument.load("d:\\filename.pdf");
pdf.print();
}
}