Sukurkite paprastą ir švarų HTML iš Microsoft® Word Docs su Mammoth

Semantiškai konvertuokite „Word“ į HTML, nesijaudindami, kad turinys bus ištrintas.

Kas yra Mamutas?

Mammoth yra lengvai naudojamas, paprastas, nesudėtingas paketas, kurį galima naudoti norint konvertuoti Word dokumentus, sugeneruotus iš Google Docs, Microsoft Word ir LibreOffice į HTML. Kaip atvirojo kodo dokumento į HTML keitiklis, „Mammoth“ yra naudingas semantiškai konvertuojant bet kokį dokumentą, nekreipdamas dėmesio į stilių, spalvą ar naudojamus šriftus.

Mammoth teikia žiniatinklio demonstracines versijas, kad pamatytų, kaip jis konvertuos dokumentus į HTML, tačiau viena geriausių šio dokumentų konverterio į HTML savybių yra daugybė platformų, kurias jis palaiko, įskaitant WordPress, Java/JVM, .NET ir Python per PyPI. Jei turite sudėtingų dokumentų, sukurtų naudojant daugybę stilių ir spalvų ypatybių, gali būti, kad galutinis rezultatas ir įvesties failas nesutampa.

Nepaisant paprastų „Word“ dokumentų, kuriuos reikia konvertuoti į HTML, „Mammoth“ atlieka darbą.

Previous Next

Darbo su Mamutu pradžia

Rekomenduojamas Mammoth bibliotekos diegimo būdas yra npm. Norėdami sklandžiai įdiegti, naudokite šią komandą

Įdiekite Mammoth per npm

 npm install mammoth 

Konvertuokite Microsoft® Word į HTML naudodami nemokamą JavaScript API

„Mommoth“ yra atvirojo kodo „JavaScript“ API, skirta nemokamai konvertuoti „Word“ į HTML. Jame yra daug funkcijų, skirtų formatuoti ir redaguoti „Word“ dokumentus, kai jie buvo konvertuoti į HTML, pavyzdžiui, pridėti antraštes, sąrašus ir vaizdus, kursyvą ir paryškintą šriftą, pridėti eilučių lūžių ir daug daugiau. Visi Word doc vaizdai pagal numatytuosius nustatymus generuojami HTML rezultate. Taip pat galite išgauti neapdorotą tekstą iš bet kurio dokumento naudodami funkciją mammoth.extractRawText, tačiau ji nepaisys originalaus dokumento formatavimo.

Konvertuoti esamą .docx failą į HTML

var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
  .then(function(result){
    var html = result.value; // The generated HTML
    var messages = result.messages; // Any messages, such as warnings during conversion
  })
  .done(); 

Susieti stilius iš Word į HTML per JavaScript API

Dažniausiai „Mammoth“ susieja bendrus „Microsoft Word“ DOCX stilius iš originalaus „Word“ dokumento į HTML galutinį rezultatą. Elementai, tokie kaip „Word“ antraštė 1, HTML konvertuojami į H1. Tačiau „Mammoth“ teikia daug funkcijų, skirtų stiliams konvertuoti iš „Word doc“ į HTML.

Individualizuoto stiliaus žemėlapis

var mammoth = require("mammoth");
var options = {
  styleMap: [
    "p[style-name='Section Title'] => h1:fresh",
    "p[style-name='Subsection Title'] => h2:fresh"
  ]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);
 Lietuvių