Mammoth ile Microsoft® Word Docs'tan basit ve temiz HTML oluşturun
İçeriğin silinmesi konusunda endişelenmeden Word'ü anlamsal olarak HTML'ye dönüştürün.
Mamut nedir?
Mammoth, Google Dokümanlar, Microsoft Word ve LibreOffice'den oluşturulan Word belgelerini HTML'ye dönüştürmek için kullanılabilen, kullanımı kolay, basit, sorunsuz bir pakettir. Açık kaynaklı bir Doc to HTML dönüştürücüsü olan Mammoth, kullanılan stil, renk veya yazı tiplerine odaklanmadan herhangi bir belgeyi anlamsal olarak dönüştürmek için kullanışlıdır.
Mammoth, dokümanları HTML'ye nasıl dönüştüreceğini görmek için web demoları sağlar, ancak bu Doc dönüştürücünün HTML'ye en iyi özelliklerinden biri, WordPress, Java/JVM, .NET ve PyPI aracılığıyla Python dahil olmak üzere desteklediği birçok platformdur. Birçok stil ve renk özelliği ile oluşturulmuş karmaşık belgeleriniz varsa, sonuç ile girdi dosyası arasında bir uyumsuzluk bulmak mümkün olabilir.
Ne olursa olsun, HTML'ye dönüştürülmesi gereken basit Word belgeleri için Mammoth işi halleder.
Mamut'a Başlarken
Mammoth kütüphanesini kurmanın önerilen yolu npm'dir. Sorunsuz bir kurulum için lütfen aşağıdaki komutu kullanın
Mammoth'u npm ile yükleyin
npm install mammoth
Ücretsiz JavaScript API aracılığıyla Microsoft® Word'ü HTML'ye dönüştürün
Mommoth, Word'ü Ücretsiz Olarak HTML'ye dönüştürmek için açık kaynaklı bir JavaScript API'sidir. Başlıklar, Listeler ve resimler ekleme, İtalik ve kalın yazı tipi, satır sonları ekleme ve çok daha fazlası gibi HTML'ye dönüştürüldüğünde Word belgelerini biçimlendirmek ve düzenlemek için birçok özellik sağlar. Word belgesindeki tüm resimler, varsayılan olarak HTML sonucunda oluşturulur. Mammoth.extractRawText işlevini kullanarak herhangi bir belgeden ham metin de çıkarabilirsiniz, ancak orijinal belgedeki biçimlendirmeyi yok sayar.
Mevcut bir .docx dosyasını HTML'ye dönüştürün
var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
.then(function(result){
var html = result.value; // The generated HTML
var messages = result.messages; // Any messages, such as warnings during conversion
})
.done();
JavaScript API aracılığıyla Word'den HTML'ye Eşleme Stilleri
Mammoth, çoğunlukla, ortak Microsoft Word DOCX stillerini orijinal bir Word belgesinden HTML nihai sonucuna eşler. Word'deki Başlık 1 gibi öğeler HTML'de H1'e dönüştürülür. Ancak Mammoth, stilleri Word belgesinden HTML'ye dönüştürmek için birçok işlev sağlar.
Özel Stil Haritası
var mammoth = require("mammoth");
var options = {
styleMap: [
"p[style-name='Section Title'] => h1:fresh",
"p[style-name='Subsection Title'] => h2:fresh"
]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);