Nyílt forráskódú Java API Word DOCX dokumentumokhoz

Microsoft Word DOCX-fájlok létrehozása, olvasása, szerkesztése és konvertálása, szövegek és táblázatok hozzáadása a Java-könyvtáron keresztül.

A DOCX4J egy JAXB-alapú nyílt forráskódú (Apache v2) könyvtár a Microsoft Office fájlformátumok manipulálására. Lehetőséget biztosít a Microsoft Word 2007 DOCX fájlformátum olvasására, írására, szerkesztésére és mentésére.

A DOCX4J hasonló a Microsoft OpenXML SDK-jához, de Java számára. A JAXB-t használja a memórián belüli objektumábrázolás létrehozásához. Az API segítségével Mircosoft Office dokumentumokat generálhat, szerkeszthet, formázhat szöveget és bekezdéseket, táblázatokat és képeket szúrhat be, valamint kezelhet egyéb űrlapelemeket, és még sok mást. Alapvetően a teljesítményen van a hangsúly, ha a formátum támogatja, megteheti az API segítségével.

Previous Next

A DOCX4J használatának megkezdése

Először is telepítenie kell a Java Development Kit-et (JDK) a rendszerére. A DOCX4J hivatkozása a Maven-alapú Java projektben még egyszerűbb. Mindössze annyit kell tennie, hogy hozzáadja a következő függőséget a pom.xml fájlhoz, és hagyja, hogy az IDE letöltse és hivatkozzon a DOCX4J Jar fájlokra.

DOCX4J Maven-függőség

<dependency>
<groupId>org.docx4j</groupId>
<artifactId>docx4j-JAXB-Internal</artifactId>
<version>8.0.0</version>
</dependency>
<dependency>
<groupId>org.docx4j</groupId>
<artifactId>docx4j-JAXB-ReferenceImpl</artifactId>
<version>8.0.0</version>
</dependency>
<dependency>
<groupId>org.docx4j</groupId>
<artifactId>docx4j-JAXB-MOXy</artifactId>
<version>8.0.0</version>
</dependency>
  

Bekezdés, kép és táblázat hozzáadása a Word dokumentumokhoz

A DOCX4J lehetővé teszi a fejlesztők számára, hogy bekezdéseket és képeket adjanak a Word-dokumentumokhoz. Az API lehetőséget biztosít arra is, hogy táblázatokat adjon hozzá a DOCX-dokumentumokhoz, miközben lehetővé teszi egyszerű és beágyazott táblázatok létrehozását a felhasználó által definiált adatokkal.

DOCX Free létrehozása a DOCX4J - Java segítségével

// Create word package
WordprocessingMLPackage wordPackage = WordprocessingMLPackage.createPackage();
// Create main document part
MainDocumentPart mainDocumentPart = wordPackage.getMainDocumentPart();
// Add Paragraph
mainDocumentPart.addParagraphOfText("Open Source Java API for Word DOCX Documents");
// Save file
wordPackage.save(new File("FileFormat.docx"));

Szöveg kibontása a DOCX-ből

A DOCX4J egy speciális osztályt biztosít az adatok Microsoft Word DOCX dokumentumokból való kinyeréséhez, mindössze néhány sornyi kóddal. Ugyanígy ki tudja bontani a címsorokat, lábjegyzeteket, táblázatadatokat és így tovább egy Word-fájlból.

Szöveg kibontása a DOCX Free-ből - Java

// Load document
WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.load(new File("FileFormat.docx"));
// Load main document part
MainDocumentPart mainDocumentPart = wordMLPackage.getMainDocumentPart();
// Extract nodes
String textNodesXPath = "//w:t";
List<Object> textNodes= mainDocumentPart.getJAXBNodesViaXPath(textNodesXPath, true);
// Print text
for (Object obj : textNodes) {
  Text text = (Text) ((JAXBElement) obj).getValue();
  String textValue = text.getValue();
  System.out.println(textValue);
}                 

Word dokumentumok létrehozása és szerkesztése Java API használatával

A DOCX4J lehetővé teszi a szoftverprogramozók számára, hogy új Word dokumentumokat hozzanak létre DOCX fájlformátumban. A fejlesztők egy meglévő Microsoft Word DOCX fájlt is betölthetnek, hogy alkalmazási igényeiknek megfelelően szerkeszthessék. Lehetővé teszi új bekezdések hozzáadását, szöveg beszúrását, szövegigazítás és szegélyek alkalmazását, szövegstílus módosítását stb.

Konvertálja a Microsoft Word Docx dokumentumokat PDF-be

A nyílt forráskódú Java könyvtár docx4j teljes körű támogatást nyújt a Microsoft Word docx dokumentumok generálásához és különféle népszerű formátumokba való konvertálásához. A docx4j 3 különböző módot kínál a Microsoft Word docx dokumentumok PDF formátumba konvertálására. A következő példa a document4j (távolról fut) segítségével konvertál egy docx fájlt PDF formátumba.

EWord Docx dokumentumok konvertálása PDF-be Java-n keresztül


public class DocxFileToPDF {
public static void main(String[] args) throws IOException, Docx4JException {
File output = new File(System.getProperty("user.dir")+"/result.pdf");
FileOutputStream fos = new FileOutputStream(output); 
Documents4jRemoteServices exporter = new Documents4jRemoteServices();
exporter.export(new File(System.getProperty("user.dir")+"/../docx4j-samples-docx4j/sample-docs/sample-docx.docx") , fos, DocumentType.MS_WORD); 
fos.close();
}
}
 Magyar