Apache PDFBox
Java API для обробки PDF-документів
Бібліотека Java з відкритим вихідним кодом для створення, друку та розбивання або об’єднання PDF-документів у програмах Java.
Apache PDFBox — це бібліотека Java з відкритим кодом для роботи з документами PDF. Використовуючи цю бібліотеку, розробники Java можуть розробляти програми Java, які створюють нові PDF-документи та з легкістю маніпулюють існуючими PDF-документами. Це також дозволяє розробникам читати та видобувати вміст із документів PDF. На додаток до цього, PDFBox також містить утиліту командного рядка для виконання різних операцій над документами PDF за допомогою доступного файлу Jar.
Портативний формат документа (PDF) — це формат файлу, який допомагає подавати дані у спосіб, який не залежить від прикладного програмного забезпечення, апаратного забезпечення та операційних систем. Apache PDFBox підтримує кілька розширених функцій, таких як створення, візуалізація, друк, розділення, об’єднання, зміна, перевірка та вилучення тексту та метаданих PDF-файлів.
Початок роботи з Apache PDFBox
Перш за все, вам потрібно завантажити останню версію зі сторінки завантаження PDFBox. Щоб успішно створити PDFBox, вам потрібно встановити Java 7 або новішої версії та Maven 3. Використовуйте наступну команду побудови
Команда встановлення
mvn clean instal
Команда скомпілює вихідні коди Java і запакує бінарні класи в пакети jar за замовчуванням.
Java API для створення та редагування нових PDF-документів
Apache PDFBox дозволяє програмістам створювати новий документ PDF з нуля. Після створення документа розробники можуть зберегти документ у потрібному місці. PDF є одним із найпоширеніших форматів файлів на сьогоднішній день. PDF-документи сумісні з різними платформами та являють собою документ незалежно від апаратного забезпечення, операційної системи та прикладного програмного забезпечення, яке використовується для його створення. PDFBox також допомагає розробникам змінювати існуючі документи PDF. Розробники можуть додавати нові сторінки, а також текст до існуючих документів сторінок.
Створення документа PDF - Java
// Create a new PDF document
PDDocument document = new PDDocument();
// Save document
document.save("fileformat.pdf");
// Close document
document.close();
Розбиття та об’єднання PDF-документів за допомогою бібліотеки Java
Apache PDFBox надає можливість об’єднувати кілька PDF-документів в один PDF-документ. Щоб об’єднати декілька документів, спершу потрібно завантажити наявні PDF-документи, а потім встановити шлях до цільового файлу. Після цього розробники можуть додати всі вихідні файли PDF у тій послідовності, яку вони хотіли б знайти в остаточному об’єднаному файлі PDF. Ми можемо розділити даний PDF-документ на кілька PDF-файлів. Цей клас Splitter використовується для поділу даного PDF-документа на кілька інших окремих документів.
Об’єднання PDF-документів – Java
// Initialize PDFMergerUtility object
PDFMergerUtility pdfMergerUtility = new PDFMergerUtility();
// Set output file path
pdfMergerUtility.setDestinationFileName("merged.pdf");
// Add source documents
pdfMergerUtility.addSource(new File("document1.pdf"));
pdfMergerUtility.addSource(new File("document2.pdf"));
// Merger documents
pdfMergerUtility.mergeDocuments(MemoryUsageSetting.setupMainMemoryOnly());
Додавайте та витягуйте зображення до PDF-документів у програмах Java
Apache PDFBox допомагає розробникам Java вставляти зображення в існуючий документ PDF. Зображення завжди додають реальну цінність вмісту. Зображення допомагають нам навчатися, привертати увагу, пояснювати концепції та надихати. PDFBox надає бібліотеку для вставки зображення в PDF-документ. Ця бібліотека використовує програму Java для вставки зображень у документи PDF. API також дозволяє розробникам витягувати зображення з існуючого документа PDF і зберігати його на локальному диску.
Додати зображення в PDF - Java
// Create a new PDF document
PDDocument document = new PDDocument();
// Create a new page
PDPage page = new PDPage();
// Add page
document.addPage(page);
// Initialize PDImageXObject object
PDImageXObject pdImage = PDImageXObject.createFromFile("logo.png",document);
// Initialize PDPageContentStream object
PDPageContentStream contents = new PDPageContentStream(document, page);
// Drawing image
contents.drawImage(pdImage, 70, 250);
// Close contents
contents.close();
// save document
document.save("image.pdf");
Друк PDF-документів різними способами за допомогою бібліотеки Java
Apache PDFBox дозволяє розробникам Java друкувати PDF-документ за допомогою стандартного API друку Java. Це дозволяє розробникам друкувати документи PDF різними способами. Тепер розробники можуть друкувати документ у його фактичному розмірі, що є рекомендованим способом друку. Він підтримує друк із діалоговим вікном попереднього перегляду, а також настроюваними атрибутами. Розробники також можуть друкувати PDF-документи, використовуючи нестандартний розмір сторінки та спеціальні поля.
Роздрукуйте файл PDF через Java API
import java.awt.print.PrinterException;
import java.io.IOException;
import org.apache.pdfbox.pdmodel.PDDocument;
public class Print {
public static void main(String[] args) throws IOException, PrinterException
{
PDDocument pdf=PDDocument.load("d:\\filename.pdf");
pdf.print();
}
}