Creați HTML simplu și curat din Microsoft® Word Docs cu Mammoth
Convertiți semantic Word în HTML fără să vă faceți griji cu privire la ștergerea conținutului.
Ce este Mammoth?
Mammoth este un pachet ușor de utilizat, simplu, fără probleme, care poate fi folosit pentru a converti documentele Word generate din Google Docs, Microsoft Word și LibreOffice în HTML. Ca un convertor Doc în HTML cu sursă deschisă, Mammoth este util pentru a converti semantic orice document fără a se concentra pe stilul, culoarea sau fonturile utilizate.
Mammoth oferă demonstrații web pentru a vedea cum va converti documentele în HTML, cu toate acestea, una dintre cele mai bune caracteristici ale acestui convertor Doc în HTML este numeroasele platforme pe care le acceptă, inclusiv WordPress, Java/JVM, .NET și Python prin PyPI. Dacă aveți documente complicate create cu multe stiluri și caracteristici de culoare, este posibil să găsiți o nepotrivire între rezultatul final și fișierul de intrare.
Indiferent, pentru documentele Word simple care trebuie convertite în HTML, Mammoth își face treaba.
Noțiuni introductive cu Mammoth
Modul recomandat de a instala biblioteca Mammoth este prin npm. Vă rugăm să utilizați următoarea comandă pentru o instalare fără probleme
Instalați Mammoth prin npm
npm install mammoth
Convertiți Microsoft® Word în HTML prin intermediul API-ului JavaScript gratuit
Mommoth este un API JavaScript open source pentru a converti gratuit Word în HTML. Oferă multe funcții pentru a formata și edita documentele Word atunci când acestea au fost convertite în HTML, cum ar fi adăugarea de titluri, liste și imagini, caractere italice și aldine, adăugarea de întreruperi de rând și multe altele. Toate imaginile din cuvântul doc sunt generate implicit în rezultatul HTML. De asemenea, puteți extrage text brut din orice document utilizând funcția mammoth.extractRawText, cu toate acestea, va ignora formatarea din documentul original.
Convertiți un fișier .docx existent în HTML
var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
.then(function(result){
var html = result.value; // The generated HTML
var messages = result.messages; // Any messages, such as warnings during conversion
})
.done();
Hartă stiluri de la Word la HTML prin API-ul JavaScript
În cea mai mare parte, Mammoth mapează stilurile comune Microsoft Word DOCX dintr-un document Word original în rezultatul final HTML. Elemente precum titlul 1 din Word sunt convertite în H1 în HTML. Cu toate acestea, Mammoth oferă multe funcții pentru a converti stilurile din document Word în HTML.
Hartă de stil personalizat
var mammoth = require("mammoth");
var options = {
styleMap: [
"p[style-name='Section Title'] => h1:fresh",
"p[style-name='Subsection Title'] => h2:fresh"
]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);