Luo yksinkertaista ja puhdasta HTML-koodia Microsoft® Word Docsista Mammothilla
Muunna Word semanttisesti HTML-muotoon murehtimatta sisällön pyyhkiytymisestä.
Mikä on Mammoth?
Mammoth on helppokäyttöinen, yksinkertainen ja vaivaton paketti, jolla voidaan muuntaa Google Docsista, Microsoft Wordista ja LibreOfficesta luodut Word-asiakirjat HTML:ksi. Avoimen lähdekoodin Doc-HTML-muuntimena Mammoth on kätevä muuntaa minkä tahansa asiakirjan semanttisesti keskittymättä käytettyyn tyyliin, väreihin tai fontteihin.
Mammoth tarjoaa web-demoja nähdäkseen kuinka se muuntaa asiakirjat HTML:ksi, mutta yksi tämän Doc-muuntimen HTML-muotoon parhaista ominaisuuksista on monet sen tukemat alustat, mukaan lukien WordPress, Java/JVM, .NET ja Python PyPI:n kautta. Jos sinulla on monimutkaisia asiakirjoja, jotka on luotu useilla tyyleillä ja väriominaisuuksilla, saattaa olla mahdollista löytää ristiriita lopputuloksen ja syöttötiedoston välillä.
Siitä huolimatta, yksinkertaisissa Word-asiakirjoissa, jotka on muutettava HTML-muotoon, Mammoth tekee työnsä.
Mammothin käytön aloittaminen
Suositeltu tapa asentaa Mammoth-kirjasto on npm:n kautta. Käytä seuraavaa komentoa sujuvaan asennukseen
Asenna Mammoth npm:n kautta
npm install mammoth
Muunna Microsoft® Word HTML-muotoon ilmaisen JavaScript-sovellusliittymän avulla
Mommoth on avoimen lähdekoodin JavaScript-sovellusliittymä, joka muuntaa Wordin HTML:ksi ilmaiseksi. Se tarjoaa monia ominaisuuksia Word-asiakirjojen muotoiluun ja muokkaamiseen, kun ne on muutettu HTML-muotoon, kuten otsikoiden, luetteloiden ja kuvien lisääminen, kursivoitu ja lihavoitu fontti, rivinvaihtojen lisääminen ja paljon muuta. Kaikki Wordin doc:n kuvat luodaan oletusarvoisesti HTML-tuloksessa. Voit myös poimia raakatekstiä mistä tahansa asiakirjasta käyttämällä mammoth.extractRawText-funktiota, mutta se jättää huomioimatta alkuperäisen asiakirjan muotoilun.
Muunna olemassa oleva .docx-tiedosto HTML-muotoon
var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
.then(function(result){
var html = result.value; // The generated HTML
var messages = result.messages; // Any messages, such as warnings during conversion
})
.done();
Kartoita tyylit Wordista HTML:ään JavaScript API:n kautta
Suurimmaksi osaksi Mammoth kartoittaa yleisiä Microsoft Word DOCX -tyylejä alkuperäisestä Word-asiakirjasta HTML-lopputulokseen. Elementit, kuten Otsikko 1 Wordissa, muunnetaan H1:ksi HTML:ssä. Mammoth tarjoaa kuitenkin monia toimintoja tyylien muuntamiseen Word doc -tiedostosta HTML:ksi.
Mukautettu tyylikartta
var mammoth = require("mammoth");
var options = {
styleMap: [
"p[style-name='Section Title'] => h1:fresh",
"p[style-name='Subsection Title'] => h2:fresh"
]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);