用于转换 Microsoft® 文字处理文件的开源 Go 库
通过免费的 GO API 将 Microsoft Word 处理文档转换为纯文本
什么是 Docconv?
通常,在使用 Microsoft Word Processing 文档时,开发人员需要纯格式的文档文本。有时,他们会处理文本或仅以不同的格式显示。开源和免费的 API Docconv 允许 GO 开发人员以纯格式从 DOC 和 DOCX 中提取文本。
该库完全在 GO 中开发,但有一些依赖项才能正常工作。 API 需要 tidy、wv、popplerutils 和 unrtf JustText
Docconv 入门
Docconv 进入您的项目的推荐方式是使用 GitHub。请使用以下命令进行顺利安装。
通过 GitHub 安装 Docconv
$ go get code.sajari.com/docconv/...
通过 Free Go API 将 DOCX 转换为纯文本
开源库 Docconv 允许计算机程序员在他们自己的 Go 应用程序中将 DOCX 转换为纯文本。为了将您的 DOCX 转换为纯文本,您只需要加载您的文档并使用 occonv.ConvertPath() 方法进行转换。通过使用以下代码行,您可以轻松地将 DOCX 转换为纯文本。
在 GO 中将文字处理转换为文本
- 创建一个新客户端
- 使用 client.ConvertPath() 将 DOCX 转换为文本并将文件路径作为参数传递
- 检查错误
- 打印纯文本
通过免费的 GO API 将 DOCX 转换为文本
// create a new client
c := client.New()
// convert DOCX to Text
res, err := client.ConvertPath(c, "fileformat.docx")
if err != nil {
log.Fatal(err)
}
// print output
fmt.Println(res)