Atvērtā pirmkoda Go bibliotēka Microsoft® tekstapstrādes failu konvertēšanai
Konvertējiet Microsoft tekstapstrādes dokumentus vienkāršā tekstā, izmantojot bezmaksas GO API
Kas ir Docconv?
Bieži vien, strādājot ar Microsoft Word Processing dokumentiem, izstrādātājiem ir nepieciešams dokumenta teksts vienkāršā formātā. Dažreiz viņi apstrādā tekstu vai vienkārši parāda to citā formātā. Atvērtā koda un bezmaksas API Docconv ļauj GO izstrādātājiem izvilkt tekstu no DOC un DOCX vienkāršā formātā.
Bibliotēka ir pilnībā izstrādāta GO, taču tai ir dažas atkarības, lai tā darbotos pareizi. API ir nepieciešams tidy, wv, popplerutils un unrtf JustText
Darba sākšana ar Docconv
Ieteicamais veids, kā Docconv iekļauties projektā, ir izmantot GitHub. Lūdzu, izmantojiet šo komandu vienmērīgai instalēšanai.
Instalējiet Docconv, izmantojot GitHub
$ go get code.sajari.com/docconv/...
Konvertējiet DOCX uz vienkāršu tekstu, izmantojot Free Go API
Atvērtā pirmkoda bibliotēka Docconv ļauj datorprogrammētājiem pārveidot DOCX par vienkāršu tekstu savās Go lietojumprogrammās. Lai pārveidotu DOCX par vienkāršu tekstu, jums vienkārši jāielādē dokuments un jāpārvērš tas, izmantojot occonv.ConvertPath() metodi. Izmantojot šādas koda rindiņas, varat viegli pārveidot DOCX par vienkāršu tekstu.
Pārvērtiet tekstapstrādi par tekstu programmā GO
- Izveidojiet jaunu klientu
- Konvertējiet DOCX par tekstu, izmantojot client.ConvertPath(), un norādiet faila ceļu kā parametru
- Pārbaudiet, vai nav kļūdu
- Drukāt vienkāršu tekstu
Konvertējiet DOCX uz tekstu, izmantojot bezmaksas GO API
// create a new client
c := client.New()
// convert DOCX to Text
res, err := client.ConvertPath(c, "fileformat.docx")
if err != nil {
log.Fatal(err)
}
// print output
fmt.Println(res)