Lag enkel og ren HTML fra Microsoft® Word Docs med Mammoth
Konverter Word til HTML semantisk uten å bekymre deg for at innholdet blir slettet.
Hva er Mammoth?
Mammoth er en brukervennlig, enkel, problemfri pakke som kan brukes til å konvertere Word-dokumenter generert fra Google Docs, Microsoft Word og LibreOffice til HTML. Som en åpen kildekode Doc til HTML-konverterer, er Mammoth nyttig for semantisk å konvertere ethvert dokument uten å fokusere på stilen, fargen eller skriftene som brukes.
Mammoth tilbyr webdemoer for å se hvordan den vil konvertere dokumenter til HTML, men en av de beste funksjonene til denne Doc-konvertereren til HTML er de mange plattformene den støtter, inkludert WordPress, Java/JVM, .NET og Python gjennom PyPI. Hvis du har kompliserte dokumenter laget med mange stiler og fargefunksjoner, kan det være mulig å finne et misforhold mellom sluttresultatet og inndatafilen.
Uansett, for enkle Word-dokumenter som må konverteres til HTML, får Mammoth jobben gjort.
Komme i gang med Mammoth
Den anbefalte måten å installere Mammoth-biblioteket på er via npm. Bruk følgende kommando for en jevn installasjon
Installer Mammoth via npm
npm install mammoth
Konverter Microsoft® Word til HTML via gratis JavaScript API
Mommoth er en åpen kildekode JavaScript API for å konvertere Word til HTML gratis. Det gir mange funksjoner for å formatere og redigere Word-dokumenter når de har blitt konvertert til HTML, for eksempel å legge til overskrifter, lister og bilder, kursiv og fet skrift, legge til linjeskift og mye mer. Alle bilder i word doc genereres som standard i HTML-resultatet. Du kan også trekke ut råtekst fra ethvert dokument ved å bruke mammoth.extractRawText-funksjonen, men den vil ignorere formateringen fra originaldokumentet.
Konverter en eksisterende .docx-fil til HTML
var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
.then(function(result){
var html = result.value; // The generated HTML
var messages = result.messages; // Any messages, such as warnings during conversion
})
.done();
Kartstiler fra Word til HTML via JavaScript API
For det meste kartlegger Mammoth vanlige Microsoft Word DOCX-stiler fra et originalt Word-dokument til HTML-sluttresultatet. Elementer som Overskrift 1 i Word konverteres til H1 i HTML. Mammoth tilbyr imidlertid mange funksjoner for å konvertere stiler fra Word doc til HTML.
Egendefinert stilkart
var mammoth = require("mammoth");
var options = {
styleMap: [
"p[style-name='Section Title'] => h1:fresh",
"p[style-name='Subsection Title'] => h2:fresh"
]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);