Cipta HTML yang ringkas dan bersih daripada Microsoft® Word Docs dengan Mammoth
Tukar Word secara semantik kepada HTML tanpa perlu risau tentang kandungan yang dipadamkan.
Apa itu Mammoth?
Mammoth ialah pakej yang mudah digunakan, ringkas dan tidak ribet yang boleh digunakan untuk menukar dokumen Word yang dijana daripada Google Docs, Microsoft Word dan LibreOffice kepada HTML. Sebagai penukar Dokumen kepada HTML sumber terbuka, Mammoth amat berguna untuk menukar secara semantik sebarang dokumen tanpa memfokuskan pada penggayaan, warna atau fon yang digunakan.
Mammoth menyediakan demo web untuk melihat cara ia akan menukar dokumen kepada HTML, namun, salah satu ciri terbaik penukar Dokumen kepada HTML ini ialah banyak platform yang disokongnya termasuk WordPress, Java/JVM, .NET dan Python melalui PyPI. Jika anda mempunyai dokumen rumit yang dibuat dengan banyak gaya dan ciri warna, anda mungkin menemui ketidakpadanan antara hasil akhir dan fail input.
Walau apa pun, untuk dokumen Word mudah yang perlu ditukar kepada HTML, Mammoth menyelesaikan tugas.
Bermula dengan Mammoth
Cara yang disyorkan untuk memasang perpustakaan Mammoth adalah melalui npm. Sila gunakan arahan berikut untuk pemasangan yang lancar
Pasang Mammoth melalui npm
npm install mammoth
Tukar Microsoft® Word kepada HTML melalui API JavaScript Percuma
Mommoth ialah API JavaScript sumber terbuka untuk menukar Word kepada HTML secara Percuma. Ia menyediakan banyak ciri untuk memformat dan mengedit dokumen Word apabila ia telah ditukar kepada HTML seperti menambah Tajuk, Senarai dan imej, Italicize dan fon tebal, menambah pemisah baris dan banyak lagi. Semua imej dalam perkataan doc dijana dalam hasil HTML secara lalai. Anda juga boleh mengekstrak teks mentah daripada mana-mana dokumen dengan menggunakan fungsi mammoth.extractRawText, walau bagaimanapun, ia akan mengabaikan pemformatan daripada dokumen asal.
Tukar fail .docx sedia ada kepada HTML
var mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/document.docx"})
.then(function(result){
var html = result.value; // The generated HTML
var messages = result.messages; // Any messages, such as warnings during conversion
})
.done();
Gaya Peta daripada Word ke HTML melalui API JavaScript
Untuk sebahagian besar, Mammoth memetakan gaya biasa Microsoft Word DOCX daripada dokumen Word asal ke dalam hasil akhir HTML. Elemen seperti Tajuk 1 dalam Word ditukar kepada H1 dalam HTML. Walau bagaimanapun, Mammoth menyediakan banyak fungsi untuk menukar gaya daripada dokumen Word kepada HTML.
Peta Gaya Tersuai
var mammoth = require("mammoth");
var options = {
styleMap: [
"p[style-name='Section Title'] => h1:fresh",
"p[style-name='Subsection Title'] => h2:fresh"
]
};
mammoth.convertToHtml({path: "path/to/document.docx"}, options);