1. 产品
  2.   字处理
  3.   GO
  4.   Docconv
 
  

用于转换 Microsoft® 文字处理文件的开源 Go 库

通过免费的 GO API 将 Microsoft Word 处理文档转换为纯文本 

什么是 Docconv?

通常,在使用 Microsoft Word Processing 文档时,开发人员需要纯格式的文档文本。有时,他们会处理文本或仅以不同的格式显示。开源和免费的 API Docconv 允许 GO 开发人员以纯格式从 DOC 和 DOCX 中提取文本。

该库完全在 GO 中开发,但有一些依赖项才能正常工作。 API 需要 tidy、wv、popplerutils 和 unrtf JustText

Previous Next

Docconv 入门

Docconv 进入您的项目的推荐方式是使用 GitHub。请使用以下命令进行顺利安装。

通过 GitHub 安装 Docconv

$ go get code.sajari.com/docconv/...
                        

通过 Free Go API 将 DOCX 转换为纯文本

开源库 Docconv 允许计算机程序员在他们自己的 Go 应用程序中将 DOCX 转换为纯文本。为了将您的 DOCX 转换为纯文本,您只需要加载您的文档并使用 occonv.ConvertPath() 方法进行转换。通过使用以下代码行,您可以轻松地将 DOCX 转换为纯文本。

在 GO 中将文字处理转换为文本

  1. 创建一个新客户端
  2. 使用 client.ConvertPath() 将 DOCX 转换为文本并将文件路径作为参数传递
  3. 检查错误
  4. 打印纯文本

通过免费的 GO API 将 DOCX 转换为文本

// create a new client
c := client.New()
// convert DOCX to Text
res, err := client.ConvertPath(c, "fileformat.docx")
if err != nil {
    log.Fatal(err)
}
// print output
fmt.Println(res)
                        
 中国人