برای تبدیل فایلهای پردازش کلمه Microsoft® Go Library با منبع باز
اسناد پردازش ورد مایکروسافت را از طریق Free GO API به متن ساده تبدیل کنید
Docconv چیست؟
اغلب، در حین کار با اسناد Microsoft Word Processing، توسعه دهندگان به متن سند در قالب ساده نیاز دارند. گاهی اوقات، متن را پردازش می کنند یا فقط آن را در قالب دیگری نمایش می دهند. API منبع باز و رایگان Docconv به توسعه دهندگان GO اجازه می دهد متن را از DOC و DOCX در قالب ساده استخراج کنند.
این کتابخانه به طور کامل در GO توسعه یافته است، اما وابستگی هایی برای عملکرد صحیح دارد. API به JustText مرتب، wv، popplerutils و unrtf نیاز دارد.
شروع با Docconv
راه پیشنهادی Docconv برای ورود به پروژه شما استفاده از GitHub است. لطفا از دستور زیر برای نصب راحت استفاده کنید.
Docconv را از طریق GitHub نصب کنید
$ go get code.sajari.com/docconv/...
DOCX را از طریق Free Go API به متن ساده تبدیل کنید
کتابخانه منبع باز Docconv به برنامه نویسان رایانه اجازه می دهد تا DOCX را در داخل برنامه های Go خود به متن ساده تبدیل کنند. برای تبدیل DOCX خود به متن ساده، فقط باید سند خود را بارگیری کرده و با استفاده از روش occonv.ConvertPath() تبدیل کنید. با استفاده از خطوط کد زیر می توانید به راحتی DOCX را به متن ساده تبدیل کنید.
تبدیل پردازش کلمات به متن در GO
- یک مشتری جدید ایجاد کنید
- DOCX را با استفاده از () client.ConvertPath به متن تبدیل کنید و مسیر فایل را به عنوان پارامتر ارسال کنید
- خطاها را بررسی کنید
- چاپ متن ساده
تبدیل DOCX به متن از طریق Free GO API
// create a new client
c := client.New()
// convert DOCX to Text
res, err := client.ConvertPath(c, "fileformat.docx")
if err != nil {
log.Fatal(err)
}
// print output
fmt.Println(res)