Thư viện mã nguồn mở Go để chuyển đổi tệp Microsoft ® xử lý văn bản
Chuyển đổi tài liệu xử lý Microsoft Word sang văn bản thuần túy thông qua API GO miễn phí
Docconv là gì?
Thông thường, trong khi làm việc với các tài liệu Xử lý Microsoft Word, các nhà phát triển cần văn bản tài liệu ở định dạng thuần túy. Đôi khi, họ xử lý văn bản hoặc chỉ hiển thị nó ở một định dạng khác. API Docconv mã nguồn mở và miễn phí cho phép các nhà phát triển GO trích xuất văn bản từ DOC và DOCX ở định dạng thuần túy.
Thư viện được phát triển hoàn toàn trong GO nhưng có một số phụ thuộc để hoạt động bình thường. API yêu cầu gọn gàng, wv, popplerutils và unrtf JustText
Bắt đầu với Docconv
Cách khuyến nghị Docconv vào dự án của bạn là sử dụng GitHub. Vui lòng sử dụng lệnh sau để cài đặt suôn sẻ.
Cài đặt Docconv qua GitHub
$ go get code.sajari.com/docconv/...
Chuyển đổi DOCX sang Văn bản thuần túy thông qua API Free Go
Thư viện mã nguồn mở Docconv cho phép các lập trình viên máy tính chuyển đổi DOCX sang Văn bản thuần túy bên trong các ứng dụng Go của riêng họ. Để chuyển đổi DOCX của bạn sang Văn bản thuần túy, bạn chỉ cần tải tài liệu của mình và chuyển đổi nó bằng phương thức Occonv.ConvertPath (). Bằng cách sử dụng các dòng mã sau, bạn có thể dễ dàng chuyển đổi DOCX sang Văn bản thuần túy.
Chuyển đổi xử lý văn bản thành văn bản trong GO
- Tạo khách hàng mới
- Chuyển đổi DOCX thành Văn bản bằng cách sử dụng client.ConvertPath () và chuyển đường dẫn tệp làm tham số
- Kiểm tra lỗi
- In văn bản thuần túy
Chuyển đổi DOCX sang văn bản thông qua API GO miễn phí
// create a new client
c := client.New()
// convert DOCX to Text
res, err := client.ConvertPath(c, "fileformat.docx")
if err != nil {
log.Fatal(err)
}
// print output
fmt.Println(res)